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Questa raccolta è costituita da sei capitoli, corrispondenti ad al¬ 
trettanti articoli pubblicati dal2007al 2011, relativi alle tecniche 
di ripresa audio olofonica e ambisonica e alle sperimentazioni 
realizzate dal Centro Ricerche e Innovazione Tecnologica nel 
quadro delle attività coordinate dalla Direzione Strategie Tecno¬ 
logiche della Rai. 

Con l'avvento dell'alta definizione nel mondo consumer, nasce 
l'esigenza di fornire un audio multicanale, all'altezza dell'im¬ 
magine video. Gli enti di radiodiffusione devono attrezzarsi per 
cercare di produrre in modo sempre più economico ed efficace 
una traccia sonora multicanale, che meglio sposi l'esigenza di 
una visione delle immagini avvolgente ad una immagine sonora 
spaziale tridimensionale in modo da rendere lo spettatore parte¬ 
cipe, all'Interno della scena televisiva. Le tecniche di ripresa sonora 
stereofonica consolidate, le quali danno un risultato frontale e 
non tridimensionale, non sono sufficienti a garantire tale risultato. 

A partire dal 2007 il Centro Ricerche ha valutato e sperimentato 
nuovi sistemi di ripresa sonora, avendo come obiettivi l'ottimiz¬ 
zazione dei costi di produzione, una semplificazione dei problemi 
tecnici e ad un interfacciamento con le attuali infrastrutture di 
produzione audio. 

I primi tre capitoli sono dedicati alle sperimentazioni di ripresa 
con la tecnica olofonica. 

II primo capitolo illustra il sistema olofonica e le prime speri¬ 
mentazioni effettuate dal Centro Ricerche nel 2007. Il secondo 
capitolo è dedicato alle sperimentazioni condotte da gennaio 
a luglio 2008 con il microfono Holophone H2-Pro, allo scopo di 
poter verificare la sua duttilità in varie condizioni ambientali e la 
bontà dei risultati ottenuti. 


Riprese Olofoniche e Ambisoniche - Il sistema SD-VMS 



Il terzo capitolo riassume la presentazione a Torino nel 2009, in 
occasione degli 80 anni della Ricerca Rai e contemporaneamente 
al 61° Prix Italia, dei risultati ottenibili utilizzando il microfono 
olofonico per realizzare la ripresa audio multicanale associata ai 
futuri formati visivi, HDTVstereoscopica o con definizione quattro 
volte superiore (4K). 

I successivi tre capitoli sono dedicati al sistema 3D-VM5, basato 
sulla tecnica Ambisonic. Questo sistema è frutto della attività di 
ricerca effettuata dal Centro Ricerche in stretta collaborazione 
con la società AIDA ed in particolare con il prof Angelo Farina e 
l'ing. Andrea Capra del Dipartimento di Ingegneria Industriale 
dell'Università di Parma. Il sistema, brevettato, permette la ripresa 
multicanale utilizzando un sola sonda microfonica dotata di 32 
capsule e la sintesi, sulla base della teoria Ambisonic, di un insie¬ 
me di microfoni virtuali. Grazie all'uso di un joystick è possibile 
definire in modo semplice sia il palar pattern, sia il puntamento 
di ciascuno dei sette microfoni virtuali sintetizzabili. 

II quarto capitolo descrive, brevemente, la teoria ambisonic e gli 
elementi costituenti il sistema, oltre alla prima serie di sperimen¬ 
tazioni, atte ad individuare e definire i campi di applicazione. 

Il quinto ed il sesto capitolo forniscono ulteriori informazioni 
sull'evoluzione del sistema e, con maggiore dettaglio, le presta¬ 
zioni valutate sulla base delle sperimentazioni condotte nella 
seconda metà del 2010 e nel 2011. 


Torino, settembre 2011 


Leonardo Scopece 


Cura editoriale, grafica e immagine: Marzio Barbero 
Foto relative alle sperimentazioni: Enrico Cavallini 
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Acronimi e sigle 


3D-VIV1S 

3D - Virtual Microphone System 

ADAT 

in origine Alesis Digital Audio Tape, ora in¬ 
dica l'interfaccia ottica per il trasferimento 
dell'audio digitale (ADAT Optical Interface) 

AIDA 

Advanced Industriai Design in Acoustic 

CAT5 

cavo di CATegoria 5 per Ethernet 

CAT6 

cavo di CATegoria 6, adatto fino a 10-Gi- 
gabit Ethernet 

CTF 

Common Transfer Function 

DTF 

Directional Transfer Function 

DTS 

Digital Theater Systems 

EBU 

European Broadcasting Union 

ESS 

Exponential Sine Sweep 

EMIB 

Eigenmike® Microphone Interface Box 

FFADO 

Free FireWire Audio Drivers 


FIR 

Finite Impulse Response 

HRIR 

Flead Related Impulse Response 

HRTF 

Flead Related Transfer Function 

GUI 

Graphic Use Interface 

HOA 

Fiigh Order Ambisonic 

IID 

Interaural Intensity Differences 

IIR 

Infinite Impulse Response 

ITD 

Interaural Time Difference 

LFE 

Low Frequency Effects 

MATLAB 

MATrix LABoratory, ambiente per il calcolo 
numerico e relativo linguaggio 

MIDI 

Musical Instrument Digital Interface 

SDDS 

Sony Dynamic Digital Sound 






Qualità 


AN'incontro, realizzato con il patrocinio della Provincia di Salerno, 
hanno partecipato docenti universitari, 
operatori di comunicazione, musicisti ed 

esperti di tecnologie in rappresentanza della ricerca e dell'industria. 


Fra i contributi presentati dal Centro Ricerche Rai al convegno, che si e tenu 
to il 16 giugno, uno riguardava la ripresa olofonica. 


sinistra: Antonio Bottiglieri (dirigente Rai) 
i (direttore di Strategie Tecnologiche Rai), 
Paolo Imperato (sindaco di Ravello) e 
Luigi Nicolais (ministro per le Riforme e l'Innovazione nella Pubblica Amministrazione) 


Dal 15 al 17 giugno 2007 si è tenuto alla Villa Rufolo 
di Ravello, la Città della Musica, 
il 2° incontro dedicato alla Qualità Tecnica della Musica 
organizzato dalla Direzione StrategieTecnologiche della Rai. 





Ripresa Olofonica e H2-Pro ' 

0 

'/ , a , 







^ OLOFONIA 

J una ripresa sonora di tutto ciò che ci circonda 


Testo e figure tratti dall'articolo di Leonardo Scopece pubblicato su 
Elettronica eTelecomunicazioni, Agosto 2007 


1. Introduzione 

Nel XIX Secolo Hermann von Helmholtz e lord Ray- 
leigh avviarono gli studi sulla propagazione delle 
onde e il comportamento dell'energia sonora; con 
l'invenzione del microfono e del fonografo nel 1877 
iniziò una nuova fase tecnologica che ha consentito 
di memorizzare su un supporto fisico gli eventi so¬ 
nori. Col passare degli anni il microfono si è evoluto 
fino ad arrivare a quel meraviglioso strumento di 
cattura, dotato delle caratteristiche meccaniche, 
elettriche e fisiche che tutti coloro che operano 
nel campo professionale possono apprezzare. 
Contemporaneamente si sono evolute le tecniche 
per catturare nel modo più verosimile il mondo dei 
suoni da cui si è circondati. 

Nascono così varie tecniche di ripresa sonora: 

J3 la monofonia, riproduzione di una sola sor¬ 
gente sonora utilizzando un solo microfono; 

J3 la stereofonia, termine che deriva dalla com¬ 
posizione di due parole greche stereo, solido, 
spaziale, e phóni'a, voce, suono, che, utiliz¬ 
zando almeno due microfoni, permette un 
ascolto più "aperto", più spaziale del sistema 
precedente, ma comunque limitato allo spazio 
compreso tra due altoparlanti frontali; 

la quadrifonia, un sistema stereofonico di 
registrazione e riproduzione contemporaneo 


su quattro canali. La ripresa quadrifonica si ef¬ 
fettua ponendo di fronte alla sorgente sonora 
quattro microfoni, registrando, ad esempio, su 
quattro tracce separate di un supporto magne¬ 
tico e riproducendo tramite quattro altopar¬ 
lanti che "avvolgono" l'uditore. Ma il risultato 
ottenuto è abbastanza deludente rispetto alle 
aspettative, perché consente solo una riprodu¬ 
zione posteriore dei segnali frontali. 

Da circa due decenni si è riesciti a riprodurre, svi¬ 
luppando tecniche basate sulla simulazione fisica 
e sull'uso di algoritmi matematici, il suono nello 
spazio che ci circonda, utilizzando cinque o più 
altoparlanti. 

2. Le tecniche per la ripresa stereofonica 

Quando si vuole effettuare una ripresa sonora si 
hanno a disposizione varie tecniche che, a parte 
quella monofonica, utilizzano più microfoni, o mi¬ 
crofoni stereo con l'ausilio di microfoni"normali"per 
"rinforzare"particolari zone della scena, zone riprese 
fuori fuoco con i soli microfoni stereo. 

Fino agli inizi degli anni '80 la tecnica più utilizzata 
dai broadcaster è stata senza dubbio la tecnica 
multimicrofonica. Essa consiste nella ripresa con 
più microfoni a "copertura" molto stretta: è uti¬ 
lizzata soprattutto nel caso di una ripresa audio 
associata ad una video quando la scenografia ha 
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la precedenza dal punto di vista artistico. E'tuttora 
valida in programmi come il Festival di Sanremo, o 
nella ripresa di "zone orchestrali", che permettono 
di riprendere, ad esempio, i primi violini, i secondi 
violini, le viole, eccetera. Questa è l'unica tecnica 
che consente di avere il controllo pressoché totale 
sulla ripresa anche del singolo strumento in scena, 
basta aggiungere microfoni a sufficienza. Ci sono 
vari problemi da risolvere prima della messa in onda 
0 della registrazione: il posizionamento fisico dei 
microfoni, la loro messa in fase, il loro esatto posi¬ 
zionamento virtuale tramite il pan-pot, l'equilibrio 
energetico tra le varie sezioni o i vari strumenti 
ripresi. Il risultato è un suono molto "pulito", pre¬ 
sente, completamente "a fuoco", un segnale stereo 
sicuramente mono-compatibile, ma con un fronte 
piatto, non profondo. 

Per ovviare a questo inconveniente si è sviluppa¬ 
to un altro tipo di ripresa caratterizzato da una 
maggiore profondità di scena, in cui gli strumenti 
musicali risultato posizionati virtualmente dove in 
realtà si trovano, sul palcoscenico. A questo punto 
cambia totalmente modo di "sentire". E'preferibile 
avere tutti gli strumenti in primo piano, puliti e a 
fuoco, o dare all'ascoltatore la sensazione di realtà 
dell'evento sonoro? Difronte ad un'orchestra non 
percepiamo o in modo pulito tutti gli strumenti, 
ma il cervello, soprattutto quello di un "pubblico 
educato", è grado, grazie alla capacità di effettuare 



Fig. 1 - Tecnica XY. 


l'ascolto intenzionale, di discriminare e esaltare 
alcuni elementi sonori o uno solo. 

Si è cercato di ottenere è un prodotto virtuale più 
vicino alla realtà, più "impastato", più"totale", rinun¬ 
ciando chiaramente alla possibilità di controllare 
totalmente le singole componenti delle sezioni so¬ 
nore. Questo risultato è ottenuto grazie a tecniche 
che utilizzano anziché semplici microfoni, singoli 
microfoni con doppia capsula a doppia membrana. 

Le tecniche stereofoniche più utilizzate sono: l'XY, 
la Stereosonic, l'MS, la AB e la Testa artificiale. 

Queste tecniche appartengono a due famiglie: 

tecniche a coincidenza (XY, Stereosonic, MS), 
che utilizzano microfoni a doppia capsula 
presenti sullo stesso corpo microfono e in asse 
tra di loro, quindi a coincidenza di fase e con 
risultato sempre mono-compatibile; 

J3 tecniche ad esclusione (AB e la Testa artificia¬ 
le), con microfoni che hanno le due capsule 
distanziate nello spazio, ossia non in asse tra 
loro, esiste quindi la possibilità che l'onda 
sonora, se arriva lateralmente al microfono, 
compia percorsi diversi per arrivare alle due 
capsule, quindi con fasi differenti, e di conse¬ 
guenza non sempre il segnale ottenuto risulta 
mono-compatibile. 

La tecnica XY utilizza un microfono a coincidenza. 
Le capsule sui microfoni a coincidenza sono tali per 
cui una rimane rigidamente ferma rispetto al corpo 
microfono, l'altra la si può ruotare con un angolo 
anche abbastanza ampio. Con questa tecnica, come 
per le altre che si stanno analizzando, l'angolo tra le 
capsule è quello canonico di 90°. 

Ad esempio, il microfono Neumann SM 69 fet ha 
la capsula non fissa che può ruotare di 270° e per 
ognuna delle due capsule si può scegliere la diret¬ 
tività in modo indipendente tra omni-direzionale, 
cardioide o bi-direzionale. 

Il risultato acustico della tecnica XY non è piena¬ 
mente soddisfacente perché in ascolto il fronte dà 
l'impressione di essere abbastanza stretto, gli ele¬ 
menti S, ed (figura 1) non risultano uscire dai due 
altoparlanti posti in modo canonico a ±30° rispetto 
all'osservatore, ma formano un angolo di circa ±10°. 
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La tecnica Stereosonic si basa su un microfono a 
coincidenza, in cui entrambe le capsule selezionate 
hanno direttività a 8 o bi-direzionale e sono ruotate 
una rispetto all'altra di 90°. Il fronte sonoro in questo 
caso è ampio, va dall'altoparlante di sinistra a quello 
di destra, ma si verificano un paio di problemi: la 
sorgente S, (figura 2 ) viene ripresa con una sensi¬ 
bilità maggiore rispetto ad ed S 3 , risultando così 
rientrante al centro rispetto al fronte, quindi questo 
è arcuato e rientrato al centro; le capsule posteriori 
sono in controfase rispetto a quelle anteriori, ma 
sono in fase tra loro, quindi c'è uguale sensibilità 
tra la coppia di lobi posteriore e la coppia di lobi 
anteriore: non è quindi possibile quindi posizionare 
il microfono in verticale, ma occorre rivolgerlo verso 
la scena sonora, presenta quindi problemi nei casi 
di elevato rumore ambientale. 

La tecnica MS consiste nel selezionare una capsula 
in situazione bi-direzionale e l'altra, puntata verso 
il palcoscenico, in modo cardioide; l'angolo fra le 
due capsule è 90° (figura 3). Il segnale dell '8 viene 
sdoppiato e inviato su due ingressi di un mixer, 
messi in controfase uno rispetto all'altro, ottenendo 
così due segnali che chiamiamo -S e -i-S. Il segnale 
dell'altra capsula, che chiamiamo M, viene inviato 
ad un terzo ingresso del banco mixer. 

Quando si miscelano i tre dosatori si ottengono le 
somme (M-i-S) ed (M-S), che corrispondono di fatto 
alla decodifica stereo che dà luogo ai segnali Left 
e Right. Quindi questa è una tecnica di "codifica" 
stereo, piuttosto che di "ripresa" stereo. Il risultato 
acustico è molto buono, ampio, profondo ma con 
una particolarità: le alte frequenze ad un livello un 
po'sostenuto sembra che "svolazzino", sembra che 
gli strumenti che le generano non siano localizza¬ 
bili in modo preciso, ma è sicuramente un prezzo 
accettabilissimo da pagare in cambio della qualità 
ottenibile. 

La tecnica a Testa artificiale è stata introdotta in 
Germania. L'idea di base è che, per effettuare la ri¬ 
presa più reale possibile, occorra ricreare in campo 
di ripresa le stesse condizioni fìsiche della presenza 
umana, quindi riflessione e diffrazione della testa 
dell'uomo. All'interno dei lobi auricolari (figura 4) 
sono inseriti due microfoni omni-direzionali quindi 
è una tecnica ad esclusione. Il risultato è buono per 
l'ascolto in cuffia, molto meno per ascolto in aria, 
ossia su altoparlanti, probabilmente perché per 


90 ° 



Fig. 2 - Tecnica Stereosonic. 



Fig. 3 - Tecnica MS. 



Fig. 4- Microfono Neumann KU 100. 
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l'ascolto in aria, oltre la riflessione e la diffrazione 
della Testa artificiale in fase di ripresa, gli stessi 
fenomeni sono generati anche dalla testa dell'os¬ 
servatore, in fase di ascolto. 

In cuffia si ha un ascolto più piacevole di quello che 
si può ottenere con altre tecniche, perché l'imma¬ 
gine sonora, invece di concentrarsi lungo la striscia 
che unisce i due padiglioni del mezzo trasduttore, 
e quindi dentro la massa cranica, si "visualizza" 
all'esterno della testa, rendendo l'ascolto più pia¬ 
cevole e meno stressante. 

Infine consideriamo la Tecnica AB, ad esclusione, 
studiata e realizzata in Francia. 

L'idea di base è simile a quella precedentemente 
descritta, ma si è evitata la doppia riflessione e la 
doppia diffrazione, non ponendo più una massa fisi¬ 
ca tra i microfoni. Si è costruito un supporto per due 
capsule cardiodi poste a 17 cm di distanza, come 
mediamente sono poste le membrane timpaniche 
nell'orecchio umano, disposte a formate un'angolo 
di 110°, inclinazione media dei padiglioni auricolari 
(figure 5 e 6). 

Il risultato è decisamente buono, spaziale, dà una 
profondità della scena molto reale e, timbricamente, 
il suono è ricco e gradevole. 

Tutte queste tecniche di ripresa stereo, in presenza 
di un palcoscenico ricco di strumenti, non possono 
avere tutti i suoni a fuoco: per ovviare al problema 
ci si affida a microfoni detti di supporto o di rinfor¬ 


Fig. 5 -Tecnica AB. 

110 ° 



17cm 


zo che vengono posizionati sulle sorgenti sonore 
sfocate, microfoni che bisogna dosare in modo 
opportuno rispetto al risultato della tecnica stereo 
di base, alcune volte è anche necessario inserire un 
ritardo sul percorso del loro segnale. 

Le tecniche stereofoniche convenzionali, finora de¬ 
scritte, non consentono riprese da cui si ottengano 
suoni veramente spaziali, totali, perché riproducono 
virtualmente le sorgenti sonore in modo frontale, 
con un fronte più o meno aperto e più o meno 
profondo. 

3. La TECNICA Olofonica - Teoria 

Agli inizi degli anni '80 il ricercatore italo-argentino 
Flugo Zucarelli applicò il modello olografico ai fe¬ 
nomeni acustici, incuriosito dal fatto che gli uomini 
sono in grado di localizzare la sorgente sonora senza 
indirizzare l'attenzione verso essa, e continuano ad 
avere questa capacità anche se sordi da un orecchio. 
Le sue conclusioni furono poi sviluppate e porta¬ 
rono ad un brevetto da parte di Umberto Gabriele 
Maggi, che insieme a suo figlio Maurizio, realizzò 
nel 1983 Vholophone, uno speciale microfono ca¬ 
pace di riprodurre suoni in tre dimensioni. Il primo 
album realizzato con questa tecnica fu "Final Cut" 
dei Pink Floyd, al quale collaborò Maurizio Maggi 
in qualità di tecnico audio. Al tempo diede buoni 
risultati solamente in cuffia, dove i suoni avvolgeva¬ 
no letteralmente l'osservatore e la sensazione della 
realtà era impressionante. Solo negli ultimi anni la 


Fig. 6 - Figura polare della tecnica AB. 
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tecnologia ha portato alla realizzazione di microfoni 
che hanno permesso di ottenere un risultato molto 
buono anche con ascolto in aria. 

L'etimologia della parola olofonia deriva dalle parole 
greche hólos, tutto, e phóni'a, voce, suono. 

Su quali principi si basa la tecnica olofonica? 

Gli attuali microfoni Holophone si basano sulla teo¬ 
ria dell'HRTF, che è a completamento delle ricerche 
effettuate sulla teoria Duplex. 

La teoria Duplex si fonda sulla stima del fenomeno 
della localizzazione spaziale di eventi sonori da 
parte delle orecchie umane. Gli effetti principali alla 
base di questo fenomeno sono: l'ITD e l'IlD. 

Per comprendere in cosa consistono i due effetti 
appena enunciati si osservino le figure 7 e 8. 

Per comprendere ITD, si ipotizzi che una delle due 
sorgenti sonore nell'ascolto stereofonico, la destra, 
sia abbastanza distante dall'osservatore, in campo 
lontano, per cui l'onda generata possa essere con¬ 
siderata piana, indipendentemente che all'origine 
sia piana o sferica. L'angolo sotteso al vertice del 


Fig. 7- Ascolto sorgente destra in con¬ 
dizione stereo canonica. 


sorgente 



triangolo isoscele con base CB (figura 7), con cui si 
rappresenta l'onda piana che arriva all'osservatore, 
può essere dunque considerato trascurabile. Inoltre 
la presenza della testa dell'osservatore è rappresen¬ 
tata come una sfera di diametro di 17 cm. 

Quando l'onda sonora è percepita dall'orecchio 
destro (Bj, essa non è ancora pervenuta all'orecchio 
sinistro (C), all'altro vertice del triangolo. Tenendo 
conto che la velocità dell'onda sonora in aria è circa 
340 m/s, per percorrere la distanza CA di 8,5 cm l'on¬ 
da impiega un tempo di 250 ps. Tale tempo non è 
ininfluente perché l'uomo riesce a percepire, come 
differenza binaurale, ritardi di tempo inferiori, fino 
a 10^20 ps, e quindi a discriminare pochi gradi per 
quanto riguarda la direzione della sorgente sonora. 

Con semplici prove si può dimostrare che per fre¬ 
quenze inferiori a 1500 Flz, per cui la lunghezza 
d'onda diventa paragonabile con la distanza tra 
le orecchie, l'orecchio destro, nell'esempio visto in 
precedenza, percepisce l'onda sonora in anticipo 
rispetto all'orecchio sinistro, e l'uditore percepisce 
chiaramente la posizione spaziale della sorgente, 
con un preciso angolo di azimuth. Nel caso si analiz¬ 
zino invece frequenze superiori a 1500 Flz, il ritardo 
interaurale porta prima ad una ambiguità e poi a 
problemi veri e propri di localizzazione spaziale 
della sorgente sonora. 

A tali frequenze diventa fondamentale per la esatta 
localizzazione spaziale la percezione della differenza 
energetica dell'onda tra un orecchio e l'altro, e su¬ 
bentra come effetto l'IlD. 

Si consideri una sorgente sonora in campo libero, 
senza pareti. In queste condizioni ciò che può in¬ 
fluenzare il sistema di analisi è il corpo umano: la 
testa, con le orecchie e il naso. Infatti, quando una 
sorgente è lontana, colpisce la testa e si deve tenere 
conto delle dimensioni della testa stessa, e da che 
direzione arriva l'onda sonora. Ricordandoli campo 
di frequenze udibili, da circa 20 Flz a circa 20000 Flz, e 
conseguenti lunghezze d'onda in gioco, da 17 m a 17 
cm, si capisce come un corpo in presenza dell'onda 
possa influenzare il percorso dell'onda stessa, a cau¬ 
sa dei fenomeni della diffrazione, della riflessione 
e del decadimento di energia in ragione di 1/Rl Si 
supponga che la sorgente sonora si trovi sullo stesso 
piano della testa ma a 90° dalla posizione frontale. 
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Fig. 8 - Differenza di ampiezza del segnale da destra in ascolto stereo canonico. 




massima ricezione da parte di un orecchio e minima 
dall'altro; si supponga che la differenza di percorso 
dell'onda, da quando ha colpito un orecchio all'altro, 
sia di circa 25 cm. La differenza di livello di pressione 
sonora tra un orecchio e l'altro è di solo 0,4 dB, che 
si può considerare impercettibile. Se la sorgente è 
molto vicina alla testa ma in posizione casuale e 
non frontale, diventa sostanziale la differenza di 
livello tra un orecchio e l'altro. Inoltre la testa lavora 
come corpo mascherante per una certa gamma di 
frequenze. Ciò porta al fatto che un segnale con 
un certo equilibrio timbrico su un orecchio, quello 
più vicino alla sorgente sonora, non è lo stesso che 
percepirà l'altro orecchio (figura 8). 

La figura 9 mostra la differenza di ampiezza misurata 
da Steinberg e Snow nel 1934, risultato che si basa 
su test effettuati con frequenze pure nel 1931 da 
Sivian e White. 


La teoria Duplex spiega però solo la capacità di loca¬ 
lizzazione spaziale della sorgente se questa si trova 
sullo stesso piano dell'osservatore, sul piano azimu¬ 
tale. Ma con questa teoria, se si tenta di localizzare 
una sorgente sonora sul piano mediano, ossia con 
angolo di elevazione differente rispetto alla testa, è 
possibile arrivare a percepire infiniti punti alla stessa 
distanza dall'orecchio con stesso ITD e IID, creando 
ciò che viene definito cono di confusione (figura 1 0). 

Dal momento che si può capire la provenienza di 
un'onda nello spazio e non solo nel piano azimutale, 
si è ipotizzato che questa capacità sia dovuta ad 
un meccanismo di ascolto monoaurale, che tiene 
conto della risposta spettrale dell'evento sonoro da 
parte del canale uditivo e dalla conformazione del 
padiglione auricolare. 

Questo ragionamento è complicato da formalizzare 
matematicamente. Le ricerche che si sono susse- 
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Fig. 9 - Differenza di ampiezza in 
funzione delle frequenze. 
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guite nel corso degli anni per comprendere come si 
possa localizzare una sorgente sonora nello spazio, 
hanno portato ad un data-base delle cosiddette 
HRTF, funzioni che tengono conto di come il suono 
proveniente da vari punti dello spazio viene filtrato 
dall'orecchio umano. Cioè, si sono registrate le ri¬ 
sposte impulsive dell'orecchio ad eventi generati in 
vari punti dello spazio con varie angolazioni, per poi 
analizzarle e cercare di capire quali possano essere 
le relazioni che regolano questi risultati. 

Le HRTF sono funzioni che, con opportuni ritardi in¬ 
trodotti in un segnale sonoro, permettono di capire 
la sua localizzazione spaziale. Per poter calcolare, 
quindi, la pressione acustica dovuta ad una sorgen¬ 
te qualsiasi x(t) nello spazio, bisogna conoscere la 
risposta all'impulso del timpano, la cui funzione è 
definita HRIR. La trasformata di Fourier H(f) di tale 
risposta è appunto la HRTF. 

Per elaborare un suono tridimensionale tenendo 
conto, quindi, dei fenomeni prima elencati, cioè 
l'ITD, l'IlD e la modellazione della struttura spettrale 
a causa delle riflessioni, diffrazioni e conformazio¬ 
ne del padiglione auricolare, si utilizza una coppia 
di filtri FIR di lunghezza appropriata. Con i FIR un 
segnale sinusoidale che li attraversa uscirà ancora 
sinusoidale, ma scalato in ampiezza e ritardato in 
fase in funzione della sua risposta in frequenza. 
Per ridurre la quantità di calcolo di detto filtro, che 
può arrivare ad essere dell'ordine di 128 punti, 
alcuni autori consigliano il filtro IIR a basso ordine, 
generalmente di 6^12 punti. A parità di ordine, a 
differenza dei filtri FIR, i filtri IIR permettono risposte 
in frequenza più ripide, introducendo però sempre 
delle distorsioni di fase, ossia le componenti spet¬ 
trali vengono ritardate in funzione della frequenza. 

Le HRTF sono misurate su entrambe le "orecchie" 
poste su un manichino, fissando un angolo di 
riferimento rispetto alla testa, e tali funzioni sono 
misurate con sorgenti poste a diversi angoli azi¬ 
mutali e diversi angoli mediani, di elevazione. Le 
HRTF includono anche le informazioni di differenza 
di tempo interaurale e di differenza di intensità 
interaurale. Le ITD sono comprese nello spettro di 
fase del filtro FIR, mentre le IID sono comprese nella 
risposta in potenza del FIR. 

Tornando al manichino, si utilizzano due microfoni 
inseriti nei suoi padiglioni auricolari e si inviano, 
tramite un altoparlante posto con un certo angolo 



di azimuth, un certo angolo di elevazione e ad una 
certa distanza, diversi stimoli che potrebbero essere 
anche dei semplici clicko sequenze binarie pseudo- 
random. La funzione di trasferimento che si ottiene 
comprende, ovviamente, anche le funzioni di tra¬ 
sferimento degli apparati utilizzati per la misura, 
come i microfoni e gli altoparlanti. Queste funzioni 
di trasferimento sono chiamate CTF e vengono poi 
eliminate dalla misura della risposta complessiva 
del sistema. 

Come risultato finale delle misure si ottiene un set di 
funzioni di trasferimento direzionale, le DTF, ognuna 
per una ben precisa posizione nello spazio. E'pro¬ 
prio questo set di funzioni che viene chiamato HRTF. 

Le tecniche di rilevazione e di calcolo delle HRTF 
si basano su vari metodi, ma i due principali sono 
i seguenti. 

Il primo con modelli sferici che simulano la testa 
umana. In questo caso, utilizzando una sorgente 
sonora piana ad una data frequenza, si può calcolare 
la pressione acustica su due punti della sfera dove si 
ipotizza siano localizzate le orecchie. Si effettuano 
vari calcoli a differenti frequenze e a diversi angoli 
azimutali e mediani, ottenendo così un set di HRTF. 

Per il secondo modello si utilizza un manichino con 
due microfoni nei lobi auricolari. Si effettuano le 
misure in camera anecoica e con un gran numero 
di punti di generazione sonora nello spazio. 
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4. La tecnica Olofonica - Sperimentazione 

Vari costruttori, da un po'di anni, hanno cominciato 
a soddisfare l'esigenza da parte dei broadcaster di 
poter effettuare riprese sonore che possano dare 
un risultato sonoro immediato dell'ambiente. Tra i 
prodotti che hanno questo scopo, il Centro Ricerche 
della Rai ha scelto di valutare e sperimentare un mi¬ 
crofono della ditta canadese Holophone, che è stato 
utilizzato in trasmissione dalla Fox, NBC, ABC, CBS, 
CBC, e ESPN, oltre che dalla EA Sports per videogio¬ 
chi, e da artisti famosi quali Elton John, Celine Dion 
e Iron Maiden e per riprese sportive (NBA Basketball, 
NEL Football e NHL Hockey). 

La ditta Holophone produce tre modelli di microfoni 
olofonici: H2-PRO, H3D e H4 SuperMini. 

L'Holophone H2-PRO (figura 1 1), scelto per questa 
sperimentazione, è un microfono professionale 
che ha sette capsule localizzate esternamente sul 
perimetro del supporto definito testa, e una interna 
che cattura la bassa frequenza. Può ottenere come 
risultato 5.1, 6.1 o 7.1 canali con suono surround. 
Tutti i suoni registrati tramite questo microfono 
sono discreti e succedono in tempo reale senza 
necessità di manipolazione da parte di mixer o 
quant'altro e ciò lo rende molto flessibile per l'utiliz¬ 
zo in studio, per la registrazione in formati surround 
e per tutti i formati consumer come Dolby, DTS e 
Circle Surround. 



Fig. 11 - Holophone H2 PRO. 


Le sette capsule esterne, come si è detto, sono poste 
sulla superfìcie esterna della testa: sono capsule 
omni-direzionali, modello"4060"della ditta danese 
DPA, che danno la configurazione direzionale, mon¬ 
tati sull'H2 Pro, della figura 12. 

Le sette capsule montate esternamente hanno un 
range di frequenza da 20 Hz a 20 kHz, mentre quella 
interna da 20 Hz a 110 Hz. La sensibilità è di 20 mV/ 
Pa a 1 kHz con livello di pressione massima pari a 
134 dBjpi^ prima del clipping. 

Il suono surround dovrebbe essere riprodotto ab¬ 
bastanza fedelmente, anche prendendo le uscite di¬ 
rette dal microfono e inviandole a degli altoparlanti. 

Si ricordi brevemente il percorso storico per arrivare 
ad ottenere un suono veramente spaziale e totale. 
Nel 1940 Disney introdusse il suono surround nei 
cinema in occasione della sua produzione "Fan¬ 
tasia", utilizzando tre speaker dietro lo schermo e 
altri posti in posizione posteriore. Nel 1950 prese 
piede la registrazione stereofonica che parte dal 
presupposto che si ascolta con due orecchie. Poi 
si ebbero delle prove sulla quadrifonia, che non 
ebbe diffusione per assenza di materiale, costi 
elevati dei sistemi e pochissimo mercato. Nel 1970, 
con "Star Wars", George Lucas introdusse il Dolby 
Stereo che fu poi matricizzato portando ai quattro 
canali left, tight, center e rear. Oggi si hanno sistemi 
Dolby Digital che impiegano sei sorgenti: center, 
left, tight, ieft surround, tight surround, LFE. Detta 




Fig. 12 - Diagramma polare 
dell’Holophone H2 PRO. 
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configurazione è conosciuta come 5.1. Un sistema in 
competizione con il Dolby è il DTS che fu introdotto 
in occasione del film "Jurassic Park". Altro sistema 
che supporta il 5.1, è il Circle Surround. L'IMAX usa 
il 6.1 aggiungendo un canale superiore al 5.1, con¬ 
figurazione supportata anche da Holophone. Solo 
recentemente Dolby, DTS e SRS Labs hanno esteso 
i loro sistemi alla configurazione 6.1 aggiungendo 
un canale posteriore centrale (Dolby Digital EX, DTS 
ES e Circle Surround II). I nfine la Sony ha introdotto 
un nuovo standard, SDDS con la configurazione 7.1, 
che ha tolto il canale superiore e ha introdotto il left 
cantere il righi center. 

L'Holophone H2 PRO in uscita ha otto cavi bilanciati 
XLR così assegnati: 


Canali 

Microfono 
Holophone H2 PRO 

1 

Left 

2 

Right 

3 

Center 

4 

LFE 

5 

Left Surround 

6 

Right Surround 

7 

Top 

8 

Center Rear 


Si illustrano ora le sperimentazioni effettuate dal 
Centro Ricerche con il microfono olofonico. 

La prima sperimentazione aveva lo scopo di veri¬ 
ficare la "pulizia"dei suoni degli strumenti durante 
l'esecuzione di un'orchestra sinfonica. 

Presso l'Auditorium Rai di Torino, e con la colla¬ 
borazione dei tecnici di Radiofonia, si è posto il 
microfono su un'asta all'altezza di circa 3,5 metri, 
rivolto verso il centro del palcoscenico, alle spalle 
del direttore d'orchestra (figura 13). 

Le otto uscite del microfono sono state collegate 
al mixer (figura 14) che alimentava con la phantom 
le capsule a condensatore del microfono e pream- 
plifìcava i segnali prima di inviarli in registrazione, 
singolarmente, in un registratore digitale (figura 1 5). 

Una volta ottenuta la registrazione su otto tracce se¬ 
parate del nastro digitale, si sono acquisite tali tracce 



Fig. 13- Ripresa aH’Auditorium Rai di Torino durante 
le prove della Sinfonia n. 2 in mi minore op. 27 di 
Sergej Rachmaninov, diretta da Kwamé Ryan. 



Fig. 14 - Mixer Yamaha 01V 96. 



Fig. 15 - Registratore digitale Tascam DA-98 HR. 
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tramite un Macintosh PowerPC G5, con quattro 
processori da 2,5 GHz cadauno, DDR2 SDRAM da 4,5 
GB e velocità di Bus da 1,25 GHz. Con il programma 
"Soundtrack"si sono poi indirizzati i segnali sui 5.1 
speaker in regia. 

Il risultato ottenuto è qualcosa di inaspettato. 
Ci si attende un suono frontale, con pochissimo 
effetto surround. Riascoltando il risultato, invece, 
sembra di essere immersi all'interno dell'orchestra, 
circondati da essa, e i timbri dei vari strumenti sono 
abbastanza reali. 

La seconda sperimentazione effettuata, è consistita 
nella ripresa di effetti allo Stadio Olimpico diTorino. 
La ripresa sonora è stata affiancata dalla ripresa 
video in alta definizione (figura 16). 

In questa occasione, la ripresa è stata effettuata 
alle spalle di una delle due porte, leggermente 
spostata a destra rispetto alla porta stessa, sotto la 
curva che ospitava i tifosi juventini. Le condizioni 
di ripresa erano vincolate dal permesso concesso 
dagli organizzatori. 

Per poter registrare l'audio in telecamera, si è usato 
un codificatore (figura 1 7) che permette di codificare 
sei canali del microfono: si è fatta la scelta di esclu¬ 
dere il center rear e il top, e le uscite si sono inviate 
comeTotal Left eTotal Right, codificate, ai due canali 
esterni della telecamera come segnali stereo. 
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SRS Circle Surround 
Portable Encoder 
CSE-06P 
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Fig. 17 - Codificatore CSE-06P della SRS Labs. 

FIg. 16 - Riprese allo Stadio Olimpico di Tori¬ 
no durante la partita di campionato tra Juven¬ 
tus e Mantova. Si notino la testa olofonica e 
la telecamera Sony XDCAM HD PDW-F350L. 
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Fig. 18 - Decodificatore CSD-07 della SRS Labs. 


Una volta in regia, i sei canali audio sono stati "rie¬ 
stratti" decodificandoli con il decoder (figura 18). 
Sia il codificatore che il decodificatore operano con 
il sistema Circle Surround. 

Il risultato, in questo caso, è stato stupefacente per 
l'impressione che si è avuta sulla realtà degli effetti 
spaziali riprodotti. 

5. Future Sperimentazioni 

Il risultato ottenuto può essere definito inaspettato 
e originale, per quanto riguarda la ripresa musicale, 
così come si rivelò il passaggio dalla ripresa con 
tecnica multimicrofonica, con tutti gli strumenti 
presenti e a fuoco, alle tecniche stereo. L'obiettivo 
allora era di cambiare filosofia di ascolto, ossia dare 
un risultato più veritiero dell'evento sonoro: non si 
puntava ad una maggiore pulizia degli strumenti, 
bensì ad un maggior realismo dei suoni, come in 
presenza dell'orchestra. 

Oggi, nella sperimentazione effettuata, si rivoluzio¬ 
na in qualche modo il tipo di ascolto, si è immersi 
nel cuore dell'orchestra, circondati dagli strumenti. 

Per quanto riguarda la ripresa allo stadio, invece, 
si è ottenuto il risultato previsto, di realtà sonora 
spaziale. 

Si intende proseguire la sperimentazione con una 
serie di riprese, sempre di musica classica, e pertanto 
sono stati presi contatti preliminari con il Centro di 
Produzione Rai di Milano. 

Individuando posizioni opportune per il microfono, 
più in alto sulla scena e/o più lontano dal direttore 
d'orchestra, si verificherà se il risultato è conforme 
alle aspettative, cioè un risultato frontale, con 
un po' di effetto posteriore dovuto al riverbero 
deN'ambiente. Per quanto riguarda la "pulizia" 
degli strumenti, l'obiettivo è quello di far valutare 
i risultati a musicisti e ingegneri del suono, esperti 
atti a giudicare questo parametro molto soggettivo. 
Si ritiene che, anche con questa tecnica come per 
quelle stereo, se l'orchestra è disposta in uno spazio 
abbastanza ampio, siano necessari microfoni di 


"supporto" sulle sorgenti sonore distanti e legger¬ 
mente sfuocate, da mixare in modo opportuno con 
le uscite dell'Holophone. 

Sarà interessante effettuare un'altra ripresa allo 
stadio di calcio ponendosi questa volta, se pos¬ 
sibile, in posizione centrale rispetto al campo e 
provando a "inseguire" con il microfono l'azione, 
seguendo i movimenti della telecamera. Questa 
tecnica è interessante perché non complica la vita 
agli addetti ai lavori e perché può essere utilizzata 
la stessa infrastruttura già esistente negli stadi, cavi 
e eventuale mixer: l'Holofone 1-12 Pro può essere 
posizionato facilmente in campo, su un semplice 
stativo. Comunque, se si vogliono riprendere gli 
effetti del colpo sul pallone o del palo colpito, è 
chiaro che oltre questo microfono converrà lasciarne 
in campo altri, ed è certamente indubbio il grande 
risparmio logistico e operativo per la ripresa totale 
degli effetti. 

Altro evento sportivo di interesse, è una corsa cicli¬ 
stica, seguendo gli atleti su un mezzo motorizzato, 
per sentire le voci e le grida del pubblico che "cor¬ 
rono" ai lati della strada mentre si avanza. 

Altre possibili applicazioni sono per News e riprese 
in uno studio televisivo, anche se si prevede sia ne¬ 
cessario comunque microfonare opportunamente 
i partecipanti. 

In base ai primi risultati della sperimentazione, si 
ritiene che in molti casi con questa tecnica si possa 
ottenere un risultato sonoro spaziale, da utilizzare 
direttamente sugli impianti 5.1 o superiori. 

L'avvento del digitale ha consentito al broadcaster di 
fornire all'utente servizi migliori e più coinvolgenti, 
sia in campo audio che video. Questo comporta 
cambiamenti significativi anche nella catena di pro¬ 
duzione e nella relativa organizzazione del lavoro, 
con conseguenze sui costi. 

La tecnica olofonica potrebbe contribuire ad otte¬ 
nere risultati ottimali dal punto di vista della ripresa 
e dell'ascolto, con un minimo impatto sugli investi¬ 
menti e la riorganizzazione delle risorse e dell'utiliz- 
zo delle infrastrutture tecniche già esistenti. 
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OLOFONIA 

sperimentazioni con microfono Holophone H2-PRO 


Testo e figure tratti dall'articolo di Leonardo Scopece pubblicato su 
Elettronica eTelecomunicazioni, Agosto 2008 


1. Introduzione 

Nel precedente capitolo si riportano le prime valu¬ 
tazioni, basate su due riprese effettuate nel 2007, 
una relativa ad un concerto di musica classica presso 
l'Auditorium Rai diTorino e la seconda in occasione 
di una partita di calcio allo Stadio Olimpico diTo¬ 
rino. E' proseguita la serie di sperimentazioni per 
approfondire la tecnica e valutare i risultati ottenibili 
in una ampia gamma di condizioni di ripresa e di 
tipologia di prodotti. 

L'esigenza di produrre una traccia sonora multicana¬ 
le, in modo efficace ed economico, è particolarmen¬ 
te importante con l'avvento della programmazione 
HTDV, per completare l'effetto di coinvolgimento 
dello spettatore, ottenuto grazie all'alta definizione 
dell'immagine visualizzata su grande schermo. 

In questo capitolo sono illustrate dieci riprese che 
hanno consentito di realizzare prodotti, costituiti 
da immagini in alta definizione e audio multicanale, 
destinati esclusivamente alla sperimentazione e 
valutazione tecnica. 


Gli scopi principali della sperimentazione sono: 

• Verifica della bontà microfonica. 

• Verifica del miglior posizionamento del micro¬ 
fono nelle varie situazioni ambientali speri¬ 
mentate. 

• Realizzazione di un insieme di esempi di video 
streaming corredato da audio multicanale 5.1 
da rendere disponibile sul sito www.qualita- 
tecnica.rai.it in modo da dimostrare la fatti¬ 
bilità di un servizio di distribuzione di audio 
multicanale agli utenti. 

• Realizzazione di un DVD BD, disco ottico blu- 
ray, in alta definizione e con audio in surround, 
ad illustrazione dei risultati delle sperimenta¬ 
zioni. 

Prima di considerare in dettaglio le sperimentazioni 
effettuate, si vuole riferire sul sistema di registra¬ 
zione che si è realizzato associato all'Holophone 
(figura 1). 

Si ricorda che l'Holophone l-l2-Pro (figura 2) è un 
microfono professionale fornito di 8 capsule, sette 
delle quali localizzate sulla periferia del supporto. 
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Fig. 1 - Sistema di registrazione. 


RME Fireface 400 


Holofone H2-PRO 


RME QuadMic 


RME QuadMic 


MacBook Pro 



Fig. 2 - Microfono Holophone H2 PRO. 


Fig. 3 - “Sistema leggero” con apparecchiature del 
sistema di ripresa e registrazione, contenuto nel¬ 
la valigia di dimensioni maggiori, mentre quella di 
dimensioni minori è utilizzata per alimentazione. 
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"testa", e una aN'interno per la cattura delle basse 
frequenze. Si possono ottenere risultati surround 
in 5.1,6.1 e 7.1 canali. 

Il sistema consiste in due preamplificatori microfoni¬ 
ci da 4 ingressi che ricevono gli 8 segnali dell'Holo- 
phone; da qui le uscite vanno ad un convertitore A/D 
la cui uscita, via firewire, è collegata ad un Macintosh 
portatile e si registra con il software Nuendo. 

Per contenere il tutto è stata realizzata una "valiget¬ 
ta" (figura 3) facile da trasportare e da collegare al 
microfono con un cavo multipolare da 40 metri di 
lunghezza. 

2. Sperimentazioni 

A seguito dell'esperienza acquisita nel corso delle 
riprese effettuate a Torino nel 2007, nel 2008 furono 
organizzate una serie di riprese in varie condizioni 
ambientali e con varie tipologie di eventi, al fine di 
identificare il miglior utilizzo del microfono Holo- 
phone H2-Pro a seconda delle condizioni. 

2.1 Cabaret A TEATRO 

La prima sperimentazione è avvenuta il 28 gennaio 
al "Teatro della Cooperativa"a Milano. E'consistita 


nella ripresa di uno spettacolo di cabaret, dove gli 
attori erano "microfonati" (figura 4). 

Ciò ha portato inevitabilmente a riprendere diret¬ 
tamente dalle casse acustiche presenti in teatro e 
quindi ad ottenere praticamente 8 canali pressoché 
monofonici. 

Parte dei risultati delle sperimentazioni sono desti¬ 
nati alla pubblicazione nella sezione Laboratorio - 
Prove Tecniche del sito"La qualità tecnica", iniziativa 
della Direzione Strategie Tecnologiche della Rai. 

In questo caso è stata dimostrata la fattibilità della 
codifica e distribuzione per streaming video e au¬ 
dio multicanale (si è scelta la codifica tramite WME, 
Windows Media Encoder). Il segnale 5.1,48 kHz, 16 
bit, a 440 kbps è fruibile con un PC corredato da una 
interfaccia per audio surround di basso costo (nel 
corso delle prove Creative - Sound Blaster) collegata 
a 6 cassette acustiche adatte ad una postazione PC. 

Malgrado le limitazioni dovute alle condizioni di 
ripresa, è stato possibile ottenere un risultato sor¬ 
prendentemente buono, riprodotto dalla postazio¬ 
ne basata su PC, sia come pulizia sonora che come 
distribuzione sui canali surround. 

Tale risultato è stato ottenuto operando in modo 
opportuno nella fase di post-produzione. 


Fig. 4 - Milano: Teatro della Cooperativa. 
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Fig. 5 - Torino: Auditorium Rai. 



2.2 Concerto sinfonico in Auditorium 

La successiva sperimentazione ha avuto luogo in 
occasione delle prove generali della Sinfonia n. 6 
in la minore di Mahler, diretta dal direttore Marc 
AIbrecht (Auditorium Rai di Torino, 21 febbraio). 

Anche in questo caso le condizioni di ripresa non 
erano perfette: non si è potuto posizionare il micro¬ 
fono all'altezza reputata ottimale, ossia a circa un 
paio di metri sopra la testa del direttore d'orchestra 
e rivolto verso il centro del palcoscenico. Il microfo¬ 
no è stato posizionato su uno stativo all'altezza del 
direttore, alle sue spalle (figura 5). 

Il risultato è complessivamente buono: la pulizia 
timbrica degli strumenti vicini è molto veritiera, ma 
gli strumenti lontani, mascherati anche dalla testa 
del direttore, erano leggermente "fuori fuoco". Per 
ovviare a tale inconveniente, in condizioni "non 
sperimentali", sarebbe probabilmente bastato posi¬ 
zionare altri 2 o 3 microfoni di supporto a copertura 
delle ultime file di musicisti. 

In definitiva si è ottenuto un prodotto surround 
molto soddisfacente, considerando l'obiettivo di 
ottenere un buon risultato senza che ciò implichi 
un intenso impegno nella ricerca di posizionamenti 
microfonici e nella lavorazione in post-produzione. 


Tornando al risultato della ripresa, questa è "avvol¬ 
gente", e uno degli obiettivi era verificare proprio la 
presenza di tale effetto. 

E'stato realizzato anche un DVD per consentire il 
confronto di tre varianti nella codifica ac3: 

1. in 5.1, dal microfono olofonico distribuendo 
il "Top" sulle 6 tracce surround, e il "Center 
Surround"ridotto di 3 dB e distribuito sul"Left 
Surround" e "Right Surround"; 

2. in 5.1, dal microfono olofonico ma conside¬ 
rando le 6 tracce classiche, quindi escludendo 
siali "Top" che il "Center Surround"; 

3. in stereo registrato dai colleghi della Radiofo¬ 
nia in Regia Musicale. 

Chi ha effettuato una valutazione soggettiva di 
questi risultati ha riscontrato che il punto 3. è cer¬ 
tamente il più presente timbricamente e "piatto"; il 
punto 2. è il più realistico e l'I. dà un risultato molto 
reale ma più "avvolgente", più "caldo", più"pieno"di 
quello ottenuto al punto 2. 

2.3 Partita di calcio 

La terza sperimentazione è stata effettuata allo 
Stadio Meazza di Milano durante la partita di calcio 
Inter-Liverpool l'il marzo. 
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Fig. 6 -Stadio Meazza: Inter-Liverpool. 



La postazione audio era in tribuna stampa e il mi¬ 
crofono era collegato tramite 25 m di multicavo 
audio, essendo stato fissato tramite uno stativo 
alla balaustra posta a tale distanza. Rispetto alla 
ripresa effettuata qualche mese prima allo Stadio 
Olimpico diTorino, la cui esperienza è stata riportata 
nell'articolo pubblicato ad agosto 2007, si è avuto il 
vantaggio di poter posizionare il microfono al centro 
dello stadio dal lato lungo del campo (figura 6 ). 

Gli effetti sono stati "pieni", e la loro direzionalità 
riconoscibile. In post-produzione il "Top" lo si è 
distribuito agli altri 6 canali surround, il "Center" è 
stato diminuito di 3 dB per aumentare la spazialità 
frontale ed è stato diminuito anche il "Center Surr" 


di 3 dB sommandolo ai canali "Left Surround" e 
"Right Surround". 

2.4 Spettacolo teatrale in studio televisivo 

Il giorno successivo, il 12 marzo, si è effettuata una 
sperimentazione presso il Centro di Produzione Rai 
di Milano, Sala B. 

I soggetti della ripresa erano Flavio Oreglio e un 
gruppo di attori e musicisti che collaboravano con 
lui. Qui si è potuto posizionare opportunamente il 
microfono e si sono registrati 6 sketch. Uno degli 
sketch ha portato 3 soggetti a sedersi da un lato 

di un tavolo presente in sala e 
Oreglio dall'altro (figura 7). Il 
microfono è stato posizionato 
in"testa"al tavolo con le capsule 
di sinistra verso i tre, e quelle di 
destra verso Oreglio. E'stato 
interessante notare come la 
direzionalità fosse ben rispet¬ 
tata e la voce del primo attore 
a sinistra, rientrando anche 
nella capsula "Left Surround", 
desse un contributo "posteriore" 
gradevole. 

Fig. 7 - Centro di Produzione 
Milano: La bocciofila Voltaire. 






Ripresa Olofonica e H2-Pro ^ 

□ 

8 


23 









24 


Fig. 8 - Centro di Produzione 
Milano: Canzone. 


Anche la ripresa di una canzone 
ha dato buoni risultati (figura 
8). Si è potuto posizionare il 
microfono olofonico pratica- 
mente di fianco al microfono 
che il tecnico della sala aveva 
sistemato per Oreglio. Il rico¬ 
noscimento della posizione 
degli strumenti e dei cantanti è 
stato chiaro; solo la fisarmonica 
era un po'"mascherata" dalla 
percussione perché era dietro 
la percussione stessa. Lo spazio disponibile non ha 
consentito ai musicisti di"allargarsi"e di posizionare 
la fisarmonica in modo da non essere nascosta da 
altri strumenti. Se si fosse alzato l'Holophone, che è 
stato posizionato all'altezza della bocca di Oreglio, 
probabilmente si sarebbe potuta riprendere meglio 
la fisarmonica, ma per contro la voce sarebbe stata 
leggermente sfocata. 



strumento che"monitorava"i livelli dei vari segnali 
si è riusciti a ricostruire abbastanza fedelmente la 
"scena sonora" reale (figura 10). 

Il risultato dà l'idea di "full immersion"sonora: sem¬ 
bra di essere al centro del palcoscenico e di sentire 
gli attori e gli effetti che si muovono intorno a te, 
anche se non guardi l'immagine video. 


2.5 Spettacolo in teatro 

Quinta sperimentazione:"La Licenza", al Salone CRT 
di Milano, il 12 maggio. 

E'consistita nella ripresa di una rappresentazione 
teatrale con 2 attori che si muovevano su un palco 
tutto di legno, quindi riverberante, in un locale con 
un soffitto abbastanza basso, alto circa 4 metri. Il 
microfono è stato posizionato ad uno dei tubolari 
che supportavano le lampade, a metà della scena 
ma non centrale. Anche in questo caso il microfono 
è stato collegato tramite un multicoppia alla posta¬ 
zione di registrazione. 

Si è voluto effettuare la ripresa in modo tale che 
l'ascolto simulasse la posizione dell'osservatore 
come se fosse "dentro" la scena, quindi con mo¬ 
vimenti e rumori che si espletassero tutt'intorno 
(figura 9). Per ottenere questo si è fatto un grosso 
lavoro di post-produzione, prima pan-pottando i 
segnali in modo da ricostruire la posizione centrale 
per il microfono, poi trovando i giusti equilibri di 
livello per mettere in evidenza i "giochi" di corse, 
rumori e andirivieni degli attori. Con l'ausilio di uno 


Fig. 9 - Milano: Salone CRT. 



Fig. 10- Monitoria segnali surround. 
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Fig. 11 - Centro di Produzione di Torino: Melevisione. 



2.6 Recitazione in studio televisivo 


2.7 Concerto in chiostro 



Ripresa durante una puntata di "Melevisione", in 
uno Studio televisivo al Centro di Produzione Rai 
di Torino, il 30 aprile (figura 1 1). 

Qui, come si era ipotizzato, la ripresa non è stata 
soddisfacente per i troppi rumori ambientali: aria 
condizionata, motorizzati delle luci, e il microfono, a 
causa della notevole distanza dagli attori, necessaria 
ai fini di non"impallare"le telecamere, ha restituito 
voci sfocate. 


Fig. 12- Roma: Chiostro di San Pietro in Vincoli. 


La settima sperimentazione è stata effettuata l'11 
giugno 2008 presso l'Università di Roma "La Sa¬ 
pienza", Dipartimento di Ingegneria, a conclusione 
delI'VIIIWorkshop"Tecnologie perla Musica"(Audio 
Digitale e Musica Elettronica). 


E' stato registrato il concerto nel Chiostro di San 
Pietro in Vincoli dal titolo "Altro Mare" utilizzando 
diverse tecniche microfoniche: più microfoni del 
Gruppo Tematico per la Cinematografia Sonora 
dell'Audio Engineering Society, Sez. Italia, microfo¬ 
no Ambisonic da par¬ 
te dell'Università di 
Ingegneria di Parma 
e Holophone H2-Pro 
da parte del Centro 
Ricerche Rai. 


L'Holophone è stato 
posizionato legger¬ 
mente distante dall'or¬ 
chestra per non in¬ 
fastidire il pubblico 
presente (figura 12). 

Il risultato è stato di¬ 
screto, tenuto conto 
della distanza microfo¬ 
no-orchestra. Era pre¬ 
sente anche un rientro 
deH'ambiente circo- 
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stante il Chiostro (transito e rumori di auto e moto), 
percepibile soprattutto nei momenti di "piano" 
sonoro orchestrali; il fronte sonoro riprodotto non 
ha dato un risultato ampio, che si sarebbe potuto 
ottenere, a mio giudizio, con una disposizione dei 
musicisti meno centrale, con un fronte ampio e 
arcuato. 


musiche di Claudio Monteverdi (figura 13), a cura 
della Soprintendenza per i Beni Storici, Artistici e 
Etnoantropologici di Parma e Piacenza. 

L'ambiente è costruito interamente in legno e quin¬ 
di molto riverberante, e la distanza tra il palco e la 
postazione di registrazione era intorno ai 30 metri. 



2.8 Concerto in teatro storico 


La successiva sperimentazione si è tenuta il 21 
giugno, presso il Teatro Farnese al Palazzo della 
Piletta di Parma, in occasione di un concerto con 


Fig. 13 -Parma: Teatro Farnese. 


I materiali ottenuti con le varie tecniche utilizzate, 
saranno messi a confronto, probabilmente presso 
Radio Vaticana, verso la fine di settembre. Sarà inte¬ 
ressante osservare questi risultati per poter capire 
quale tecnica riesce a restituire la miglior "pulizia" 
timbrica e la migliore spazialità dell'evento. Chi 
ha ascoltato il risultato della ripresa olofonica ha 
comunque affermato che è molto reale e "pulita". 


Il problema della distanza palcoscenico-postazione 
è stato risolto semplicemente con un cavo multipo¬ 
lare da 40 m steso nel corridoio centrale tra le due 
ali di pubblico. 


































Invece, a causa deN'ambiente riverberante si è dovu¬ 
to provare durante le prove generali per compiere 
alcuni aggiustamenti sugli equilibri energetici sono¬ 
ri. In particolare, si è cercato il livello opportuno sulla 
voce di una delle cantanti soliste molto "potente"; 
l'altro aggiustamento ha riguardato i segnali poste¬ 
riori che, con livello delle capsule posteriori uguale 
a quello delle capsule frontali, davano un risultato 
incongruente, cioè il fronte posteriore era più alto 
del fronte anteriore. E'stato necessario attenuare 
il "Left Surr", il "Right Surr"e il "Center Surr"di circa 
8dB. 


2.9 Saggi con sax 

La demo è stata presentata a Ravello il 23 giugno, 
in occasione del Convegno "Il Nuovo nella Musica 
- Qualità Tecnica e Piattaforme Innovative" orga¬ 
nizzato dalla Direzione Rai Strategie Tecnologiche 
-Qualità Tecnica. 

In tale sede si è organizzata anche la nona speri¬ 
mentazione. A conclusione del Convegno sono 
stati ripresi brani suonati dai Maestri Carla Marciano, 
Alessandro La Corte e Eugenio Colombo. 


Il risultato così ottenuto è brillante, piacevole,"spa¬ 
ziato", con i contributi sia vocali che musicali ben 
presenti. 

A riprova della versatilità del sistema di ripresa- 
editing, è stata prodotta una clip di dieci minuti 
da presentare il giorno successivo in anteprima, a 
Ravello, dove si è riscontrato apprezzamento sul 
risultato ottenuto, anche da parte di personalità del 
settore scientifico. 


Il locale dove si è svolto il Convegno e le riprese au¬ 
dio/video è una Chiesa sconsacrata con un riverbero 
abbastanza accentuato, quindi si sono diminuiti i 
livelli delle capsule posteriori per non avere un audio 
sbilanciato all'indietro e irreale. 
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Si è posto il microfono al centro del "palco"e, nella 
prima esibizione, Alessandro La Corte alla tastiera e 
Carla Marciano al sassofono erano posti agli estremi 
della stanza (figura 14), di fronte al microfono. La 
tastiera era amplificata e il suono è stato ripreso 
dall'altoparlante associato, mentre il sassofono era 
al "naturale". 

Per la seconda sperimentazione il "virtuoso"del sax 
Eugenio Colombo (figura 15) ha deliziato la platea 
realizzando, prima di un breve brano musicale, 
effetti impensabili per tale strumento. Il musicista 
si è spostato da destra a sinistra durante la sua esi¬ 
bizione per mettere in evidenza il fenomeno della 
localizzazione. 

Il risultato, anche in ambiente come descritto in 
precedenza, è stato molto soddisfacente dando il 
senso della realtà. Inoltre, dal punto di vista timbrico, 
gli strumenti sono stati riprodotti molto fedelmente. 


2.10 Spettacolo in sito archeologico 

L'ultima sperimentazione di questa serie è coincisa 
con la prima nazionale di "Canti e Suoni dell'Ore- 
stiade", una sintesi e riscrittura teatrale della trilogia, 
l'unica completa di tutto il teatro greco, "Agamen¬ 
none", "Coefo re", "Eu m e n i d i ". 

Lo spettacolo, concepito appositamente per Pa- 
estum, è stato proposto il 3 luglio, con replica il 
6, nell'Area Archeologica, al Tempio di Nettuno 
dall'Istituto Nazionale del Dramma Antico (I.N.D.A.). 

La sperimentazione di ripresa ha riguardato la rap¬ 
presentazione del 3 luglio, poiché il 6 luglio l'Area 
Archeologica è stata interessata da altri due eventi 
interferenti, dal punto di vista sonoro, con quello 
in oggetto. 

La tragedia è interessante, dal punto di vista della 
nostra sperimentazione, perché si articola in recita¬ 
zione, canto e musica. Infatti, oltre che avvalersi di 
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un cast di eccellenti attori, sia la recitazione che il 
canto erano accompagnati da un'ottima orchestra. 

Il microfono è stato posto davanti al palcoscenico, 
al centro (figura 16). Gli attori erano "microfonati", 
quindi si sono riprese le loro voci da una coppia di 
altoparlanti ottimamente bilanciati come livello dal 
tecnico audio dell'I.N.D.A.. I musicisti, invece, piazzati 
a sinistra sul palco, suonavano senza amplificazione. 

La platea faceva quasi da chiusura al proscenio e si 
notava un riverbero che alcune volte era accentua¬ 
to, costringendo, quindi, a diminuire in postazione 
di 6 dB il "Left"e il "Right Surr", e di 9 dB il "Top" e il 
"Center Surr". 

Durante la ripresa, inoltre, si è notato il canto delle 
cicale alle spalle del microfono, che rendeva il tutto 
spettacolarmente reale. 

Un altro aspetto che si è notato, in riascolto, è come 
i fenomeni della diffrazione e della riflessione del 
corpo siano evidenti con la presenza del solo mi¬ 
crofono olofonico in campo. Ossia, quando suona 
l'orchestra, si nota benissimo che quando questa 
emette frequenze alte, queste vengono percepite 
perfettamente da sinistra, dove è posta appunto 
l'orchestra; in presenza di frequenze basse, si è av¬ 
volti letteralmente da queste! 

Il risultato della ripresa è stato molto soddisfacen¬ 
te, anche perché l'ambiente non era molto ampio, 
così come l'Anfiteatro di Siracusa, sede naturale di 
queste rappresentazioni e dove, probabilmente sa¬ 
rebbe interessante effettuare una sperimentazione, 
provando a "rinforzare" il suono aggiungendo altri 
microfoni, o utilizzando una coppia di microfoni 
olofonici. 

3. Conclusioni 

Gli obiettivi principali di questa serie di sperimen¬ 
tazioni con il microfono Holophone H2-Pro sono 
stati raggiunti, con risultati soddisfacenti rispetto 
alle aspettative. 

La qualità timbrica in molti casi è stata verificata 
appieno, negli altri casi si sono identificate le cause 


delle limitazioni: la distanza microfono-sorgente, 
l'acustica ambientale, la non possibilità di posizio¬ 
nare il microfono nel punto ritenuto ottimale. 

Si è verificata la fattibilità di postproduzione, parten¬ 
do dai risultati delle riprese, per realizzare segnali 
surround codificati WME, con un bit-rate pari a 440 
kbit/s. Il prodotto multicanale fruibile dall'ascolta¬ 
tore, dotato di PC e sistema di riproduzione (scheda 
audio e cassette acustiche) a basso costo, si può 
ritenere buono dal punto di vista sonoro. 

Infine si è realizzato, per la prima volta in Rai, un 
prodotto su BD, disco ottico blu-ray, in alta defini¬ 
zione video e surround audio, utilizzando le riprese 
effettuate con l'Holophone e telecamera Sony 
XDCAM HD. 

Le sperimentazioni proseguiranno mentre conti¬ 
nuerà la valutazione dei risultati fino ad ora raccolti. 
Un contributo interessante proverrà dalle prove 
soggettive delle riprese effettuate nel corso della 
settima sperimentazione di questa serie (Concerto 
in chiostro) a cura de "La Sapienza" di Roma per 
confrontare le diverse tecniche di ripresa applicate 
nell'occasione. 

Si ritiene che i risultati acquisiti potranno essere un 
valido contributo nella valutazione a livello azien¬ 
dale delle tecniche utilizzabili per la distribuzione di 
audio multicanale attraverso i diversi media. 
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Ripresa Audio Multicanale 


Testo e figure tratti dall'articolo di Leonardo Scopece pubblicato su 
Elettronica eTelecomunicazioni, Agosto 2009 


1. Ripresa olofonica associata 

Al NUOVI FORMATI TELEVISIVI 

Due delle dimostrazioni che le Direzioni Strategie 
Tecnologiche e Centro Ricerche e Innovazione 
Tecnologica della Rai presentate per gli 80 anni del 
Centro Ricerche Rai in occasione del 61° Prix Italia 
a Torino erano incentrate sulle evoluzioni future 
dell'immagine televisiva: la televisione stereosco¬ 


pica (HDTV-3D) e la televisione ad alta definizione 
in formato 4K (un numero di pixel quattro volte 
superiore a quello che caratterizza la HDTV). 

E' naturale che all'evoluzione dell'immagine visiva 
sia necessario associare un'evoluzione altrettanto 
significativa deN'immagine sonora, affinché l'im¬ 
mersione e il coivolgimento nella realtà della rap¬ 
presentazione sia veramente efficace. 



Prove di ripresa HDTV-3V al 
Centro di Produzione Rai di Torino: 
a sinistra la telecamera e 
a destra il microfono olofonico. 
Sullo sfondo la Mole Antonelliana. 
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Con tale intendimento, alle riprese video nei formati 
HDTV-3D e HDTV-4K sono state affiancate riprese 
tali da ottenere un audio multicanale che offra 
una sensazione, un'emozione nuova a chi non si 
accontenta più del suono stereofonico, ma vuole 
ritrovarsi immerso nel mondo sonoro, oltre che in 
quello visuale. 

Le riprese sono state effettuate mediante la tecnica 
olofonica. 

2. Il microfono olofonico 

il microfono utilizzato nel corso di tali riprese è 
l'Holophone H2 PRO. Il microfono Holophone H2- 
PRO ha otto capsule disposte opportunamente su 
una speciale "testa", sette delle quali a banda piena 


Microfono Holophone H2 PRO durante le 
riprese in Piazza Castello a Torino. 



c 



Diagramma polare dell'Holophone H2 PRO. La 
posizione delle capsule microfoniche è posta 
a confronto con la disposizione dei 5 diffusori 
nella configurazione indicata dalla raccomanda¬ 
zione internazionale ITU-R BS.775 che specifica 
con precisione le angolazioni. 

collocate sul perimetro e una per le basse frequenze 
posizionata internamente. 

Uno degli aspetti positivi di questa tecnica è che 
tutti e otto i relativi segnali in uscita dalla testa olo¬ 
fonica sono distinti tra loro, quindi non è necessario 
alcun decodificatore per accedere a ciascun segnale. 
Collegando questi otto canali ad un comune mixer è 
possibile andare direttamente in onda con un audio 
5.1, 6.1, 7.1, o anche solo stereo 2.0, se ce ne fosse 
la necessità, semplicemente utilizzando i primi sei 
canali a disposizione e codificandoli con un oppor¬ 
tuno codificatore. 
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I Gli otto segnali in uscita dalla testa olofonica 
possono essere registrati separatamente. 




























Un primo piano della telecamera 3D. 


tUflll/l 


Microfono olofonico e telecamera 3D. 


Microfono olofonico e telecamera 4K. Kani< 


Alcuni momenti della messa a punto dei sistemi 
di ripresa delle immagini e del suono. 




Telecamera 4K. |_ 
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La testa non è una sfera ma ha una forma più ap¬ 
puntita per ricreare le condizioni di impedenza della 
testa umana. 

La disposizione delle capsule non è omogenea, ma 
si nota una concentrazione maggiore davanti che 
dietro la struttura; questo è stato fatto in funzio¬ 
ne dei sistemi di ascolto surround disponibili sul 
mercato. Occorre dire infatti che la configurazione 
surround più diffusa al giorno d'oggi, che garantisce 
anche ottime qualità dal punto di vista della resa 
spaziale ricreata, è il surround 5.1. 

La disposizione non omogenea delle celle mi¬ 
crofoniche è funzione proprio della disposizione 
dei diffusori nel surround 5.1. Le capsule centrali 
posteriore e anteriore sono utili ad arricchire i due 
fronti. La capsula sulla "testa", infine, fornisce quelle 
caratteristiche di tridimensionalità che contraddi¬ 
stinguono questo microfono dagli altri presenti in 
commercio. Se si "panpottano" opportunamente i 
segnali registrati da questa capsula sui 5 canali a 
banda piena del 5.1, si riesce a ricreare un ascolto 
tridimensionale, nonostante non ci siano diffusori 
posti sopra la testa in quella posizione nella confi¬ 
gurazione 5.1. 


3. Sviluppi futuri 

Il Centro Ricerche affianca le sperimentazioni di 
microfoni olofonici con studi e sperimentazioni di 
tecnologie ancora più avanzate, in collaborazione 
con l'Università di Parma. 

4. Conclusioni 

A maggio 2009 è terminato il periodo di sperimen¬ 
tazione della tecnica olofonica per le riprese audio 
multicanale in abbinamento a riprese HDTV. Nei 
mesi di luglio e agosto 2009 si à avviata l'applica¬ 
zione di tale tecnica, in occasione delle realizza¬ 
zioni sperimentali con immagini video HDTV-4K e 
HDTV-3D. 

La ripresa olofonica è stata adottata per riprendere 
[ambiente sonoro. 

Ciò ha comportanto un disagio, quello riscontrato 
dalle troupe, costrette a lunghi periodi di silenzio 
forzato a causa della elevata sensibilità delle capsule 
del microfono H2-PRO. 

Il vantaggio, indubbiamente, è stata la realtà dei suo¬ 
ni ripresi, e sbalorditivo è stato scoprire suoni che ad 
orecchio nudo non era possibile notare per il livello 
sonoro molto basso e non percepibile dall'orecchio 
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Testo e figure tratti dall'articolo di Leonardo Scopece pubblicato 
su Elettronica eTelecomunicazioni, Aprile 2010 


1. Introduzione 

Il desiderio di sentirsi, nel proprio salotto, immerso 
in un evento, coinvolto da immagini spettacolari e 
circondato da musica e suoni realistici, è sempre 
stata una forte motivazione per cercare di trarre il 
massimo vantaggio dai continui progressi in campo 
audiovisivo e multimediale. 

L'utente già negli anni '90 era in grado di adottare 
sistemi di riproduzione audio per ottenere sensa¬ 
zioni uditive prossime a quelle percepite in una 
sala durante un concerto o uno spettacolo teatrale. 
[!home video nasce nel 1982, con l'introduzione del 
Dolby Surround. Lo spettatore ha la sensazione di 
essere al centro della scena, grazie alla presenza di 
almeno 5 diffusori, alimentati ciascuno da un canale 
audio, di cui due posizionati alle proprie spalle. 

La qualità video disponibile trenta anni fa, alla nasci¬ 
ta deW'homevideo, era ancora prossima, in termini 
di definizione, a quella disponibile alla nascita della 
televisione. I programmi erano a colori, in formato 
4:3, e diffusi (secondo lo standard PAL) o registrati 
su cassetta (VHS). E' proprio a metà degli anni '80 
che si sono avviate le prime sperimentazioni di 
HDTV: immagini, in formato 16:9, caratterizzate da 
un numero di elementi (pixel) cinque volte supe¬ 
riore rispetto a quelle della TV. La qualità video 
a cui si voleva tendere era già quella attuale, solo 
da pochi anni disponibili a casa dell'utente. La 


prima sperimentazione di trasmissione HDTV in 
formato digitale fu effettuata dalla Rai in occasione 
dei mondiali di calcio Italia '90. Si è però dovuto 
attendere vent'anni prima che la tecnologia degli 
schermi (Plasma, LCD...) rendesse oggi possibile, 
in termini di costo e ingombro, la fruizione nelle 
nostre case delle immagini HD e che i nuovi sistemi 
di diffusione digitale DVB, via satellite e terrestre, 
ne consentissero la ricezione domestica, grazie ai 
progressi in termini di efficienza nello sfruttamento 
della capacità dei canali. 

Da un decennio l'evoluzione tecnologica sembra 
aver assunto un ritmo sempre più rapido e il pros¬ 
simo passo verso l'immersione nella realtà virtuale 




televisiva sarà possibile con la diffusione di pro¬ 
grammi tridimensionali: l'avvento della televisione 
stereoscopica o 3DTV sembra prossima. 

Apparentemente tali progressi non sembrano al¬ 
trettanto rapidi e incisivi in campo audio. 

Di fatto l'utente può allestire nel proprio soggiorno 
un sistema di riproduzione adeguato, sia per quanto 
riguarda le immagini, sia il suono: un grande scher¬ 
mo e un sistema di diffusione surround. E' Vhome 
theatre: il coinvolgimento totale del telespettatore 
nella scena. Ma spesso alle immagini in alta de¬ 
finizione non si accompagna un audio di qualità 
altrettanto spettacolare. 

Occorre agire su tutta la catena, partendo dal primo 
stadio, quello della produzione: i sistemi di ripresa 
video e postproduzione devono operare con se¬ 
gnali video in alta definizione, e i sistemi di ripresa 
e postproduzione audio devono essere in grado di 
codificare segnali surround. 

Con l'obiettivo di individuare sistemi efficaci per 
produrre programmi dotati di surround, il Centro 
Ricerche Rai ha avviato tre anni fa un ampio pro¬ 
gramma di sperimentazioni. Lo scopo è la messa 
a punto di un sistema che consenta di effettuare 
riprese sonore e registrazioni con sistemi multica¬ 
nale, utilizzando le infrastrutture già esistenti, con 
costi contenuti, per offrire all'utente, nel modo più 
semplice dal punto di vista operativo, un segnale 
surround a complemento di quello video in alta 
definizione. 

2. Dalla sperimentazione all'innovazione 

I precedenti capitoli hanno illustrato le tecniche di 
ripresa stereofonica e quella olofonica e le speri¬ 
mentazione effettuate nel dal 2007 al 2009. 

Per effettuare tali sperimentazioni, in ambienti 
differenti e diverse tipologie di sorgenti sonore, si 
è utilizzato un microfono già adottato da alcune 
emittenti del Nord America e sperimentato da ce¬ 
lebri artisti: l'Holophone H2Pro. 

II microfono Holophone è dotato di 8 capsule, sette 
localizzate sulla periferia del supporto ed una all'in¬ 
terno, per l'acquisizione delle basse frequenze. Gli 
otto segnali in uscita dalla "testa" sono distinti fra 


loro: gli otto canali possono essere avviati ad un 
mixer o codificati come audio 5.1,6.1,7.1 o sempli¬ 
cemente stereo. 

La tecnica di ripresa olofonica si aggiunge alle tra¬ 
dizionali tecniche di ripresa, che presentano speci¬ 
fiche caratteristiche del suono riprodotto: 

J3 con la tecnica multimicrofonica il suono è tutto 
presente, a fuoco, pulito, ma senza profondità, 
un "muro" di suoni provenienti dagli strumenti 
disposti sulla scena. 

J3 con le tecniche stereofoniche, dall'MS, alla 
Stereosonic, all'AB, alla XY, il suono comincia ad 
essere "profondo". 

Le nuove tecniche multicanale, come quella adotta¬ 
ta da Holophone, offrono un suono avvolgente, più 
naturale, meno"a fuoco"ma più reale rispetto a quel¬ 
lo ottenibile con le tecniche fino ad ora utilizzate. 

I risultati ottenuti con le sperimentazioni citate sono 
molto interessanti e hanno consentito di compren¬ 
dere che il "modo di sentire" dei prodotti ottenuti 
con tecniche di ripresa multicanale cambia. 

Resta ora da valutare quanto differisca la percezione 
da parte del pubblico nel passaggio dal modo di 
sentire fin qui offerto, artificioso, a confronto con il 
nuovo modo di sentire, più avvolgente e più reale, 
anche se meno "presente". 

3. Il sistema basato su 

SONDA MICROFONICA H.O.A. 

In base alle conoscenze acquisite e avendo valutato 
positivi i vantaggi della ripresa multicanale, il Cen¬ 
tro Ricerche ha deciso di avviare un progetto per 
realizzare un sistema con caratteristiche innovative, 
basato sulla tecnica Ambisonic (vedere Appendice). 

Questo progetto ha portato allo sviluppo a al bre¬ 
vetto di un sistema di ripresa e registrazione basato 
sulla Sonda Microfonica HOA (High Order Ambisoni- 
cs) da parte di Rai e A.I.D.A., spin-off dell'Università 
di Parma. 

Lo scopo del sistema è di riprendere la scena sonora 
ottenendo tre risultati: 

J3 una ripresa multimicrofonica o, in alternativa, 
surround; 
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J2 poter effettuare uno zoom microfonico, ovvero 
cambiare la direttività, in modo dinamico e in 
tempo reale; 

J2 poter posizionare i punti di ripresa nello spazio 
sia sul piano azimutale che mediano sempre in 
modo dinamico e in tempo reale. 

3.1 La sonda H.O.A. e l'Interfaccia 

La sonda microfonica (figura 1) è costituita da una 
sfera di 8,4 centimetri di diametro ed ha sulla super¬ 
ficie 32 capsule da y 2 "ad elettrete di ottima qualità. 

Le capsule hanno una risposta in frequenza che va 
da 20 Hz a 20 kHz, con sensibilità di 32 mV/Pa e una 
dinamica prima del clipping di 135 dB. 

All'interno della sfera stessa sono presenti i pream¬ 
plificatori delle 32 capsule e i convertitori A/D. 

I 32 segnali digitali sono multiplati e trasferiti, me¬ 
diante un cavo ethernet di categoria 5 o superiore 
che può essere lungo fino a 140 metri, ad una inter¬ 
faccia (figure 2) in cui possono essere memorizzati 
su un dispositivo USB per elaborazioni successive 
oppure trasferiti alla unità di elaborazione. 


3.2 Unità di Elaborazione 

Costituisce il cuore del sistema. Provvede all'ela¬ 
borazione dell'audio, effettuando in tempo reale 
i complessi calcoli per l'emulazione dei filtri che 
consentono di sintetizzare i segnali corrispondenti 
a sette microfoni virtuali. 

Ognuno di questi microfoni virtuali ha un tempo di 
latenza sufficientemente basso da non inficiare la 
ripresa, ed una buona qualità su tutte le frequenze 
della banda base audio. Inoltre, ciascun microfono è 
sintetizzatato in base a tutti i 32 segnali componenti, 
prelevati dalle singole capsule. 

Il polar pattern può variare da bidirezionale, a 
omnidirezionale, a cardioide di vario ordine. Gli 
algoritmi utilizzati sfruttano il principio Ambisonic: 
l'informazione sonora in un punto dello spazio è 
ottenuta conoscendo la pressione e la velocità delle 
particelle in quel punto. 

Attualmente II sistema realizzato consente, per 
ognuno dei 7 microfoni sintetizzati, di elaborare in 
tempo reale le informazioni ottenute dalle 32 cap¬ 
sule e realizzare la sintesi di un microfono virtuale 
equivalente Ambisonic fino al sesto ordine. 
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Fig. 4 - Esempio di visualizzazione del diagramma polare 
relativo a due dei microfoni virtuali sovrapposti all'imma¬ 
gine della scena. 

La semplicità operativa è ottenuta grazie all'inter¬ 
facciamento del sistema di elaborazione con un 
joystick (figura 3) e con una telecamera wide-angle 
che permette di controllare il "puntamento" dei 
singoli microfoni virtuali. 

Grazie a tali dispositivi è possibile definire in modo 
semplice sia il diagramma polare, sia il puntamento 
di ciascuno dei microfoni virtuali, indipendente¬ 
mente l'uno dall'altro. 

Con il Joystick è possibile selezionare ciascun micro¬ 
fono, "inseguire" dinamicamente il soggetto sulla 
scena e decidere la direttività del microfono virtuale 
selezionato, visualizzando il corrispondente beam 
con un cerchio colorato, le cui dimensioni fornisco¬ 
no in modo intuitivo le sue caratteristiche, relative 
all'angolo di ripresa. 


Le informazioni relative ai singoli microfoni virtuali 
utilizzati sono visualizzate su un monitor, sovrap¬ 
poste all'immagine ripresa dalla telecamera (figura 
4). E'quindi possibile decidere in tempo reale quale 
diagramma polare adottare per ciascun microfono, 
e la loro posizione spaziale. 

Nel caso la scena sia statica o quasi, può essere utile 
usare, invece di una telecamera, una macchina foto¬ 
grafica e realizzare una fotografia panoramica, me¬ 
morizzare le posizioni dei soggetti presenti in scena 
senza "inseguirli" potendoli richiamare facilmente, 
semplificando così enormemente il lavoro (figura 5). 

3.4 La console di controllo 

Per la gestione del sistema si utilizza una console di 
controllo, un notebook. Sulla sua memoria di massa 
possono essere inoltre registrati in tempo reale i 
32 segnali provenienti dalla sonda e/o i 7 segnali 
sintetizzati corrispondenti ai microfoni virtuali. 

L'applicativo di gestione del sistema consente 
di avviare i sette segnali in uscita dal sistema di 
elaborazione allo spazio di ascolto oppure ad un 
mixer, tramite la porta ADAT, o di memorizzarli su 
un registratore audio esterno. 

I segnali memorizzati possono ovviamente subire 
un processo di postproduzione. In particolare i se¬ 
gnali corrispondenti ai 7 microfoni virtuali possono 
essere sintetizzati e modificati in postproduzione, 
a partire dall'insieme dei 32 segnali catturati grazie 
alla sonda H.O.A. 


Fig. 5 - La scelta dei diagrammi polari e il puntamento per ciascuno dei 7 microfoni virtuali può essere effettuata e 
memorizzata con l'ausilio di una foto panoramica realizzata quando la sala è vuota o durante le prove. Nell'esem¬ 
pio un microfono del sesto ordine punta al centro della scena (3), due microfoni del 3° ordine (1 e 2) a ±30°, del 2° 
ordine (6 e 7) a ±60° e dell ° ordine (4 e 5) a ±110°. Tale scelta può essere modificata nel corso della registrazione, 
o in postproduzione, selezionando ciascun microfono virtuale mediante il joystick. 
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4. Applicazione del Sistema basato su 
SONDA H.O.A. 

La gamma di applicazioni che possono trarre van¬ 
taggio dall'uso del sistema sviluppato e brevettato 
è molto ampia: si ipotizzano qui alcuni esempi, 
corrispondenti a diverse condizioni di ripresa. E'in 
corso la sperimentazione, che deve coinvolgere i 
possibili utilizzatori, per verificarne la fattibilità e la 
flessibilità di impiego del sistema. E'cosi possibile 
trarre indicazioni utili per il passaggio dalla realizza¬ 
zione prototipale a quella utilizzabile in produzione. 

4.1 Ripresa di orchestra 

Nel caso di una orchestra sinfonica, è possibile si¬ 
mulare una ripresa multimicrofonica, puntando, ad 
esempio, 6 dei 7 microfoni virtuali verso punti sta¬ 
biliti dell'ensemble e controllando dinamicamente 
un settimo soggetto, canoro o musicale, che non è 
statico sulla scena. 

Un altro esempio è la realizzazione di una ripresa 
codificata fino a 7.0 puntando 5 dei 7 microfoni vir¬ 
tuali frontalmente ed i rimanenti 2 posteriormente. 

Segnali codificati 5.1, 6.1 o 7.1 possono essere ot¬ 
tenuti elaborando i 7 segnali a disposizione e rica¬ 
vando da essi il contributo a bassissime frequenze 
LEE (Low Frequency Effect), oppure utilizzare un 
microfono aggiuntivo adibito alla ripresa di frequen¬ 
ze da 20 a 110 Hz. 

4.2 Ripresa di evento sportivo 

Allo stadio di calcio, si può ottenere un effetto am¬ 
biente in surround. E' pensabile che sia possibile, 
posizionando la sonda sul terreno di gioco a bordo 
campo, riprendere anche l'impatto del colpo sul 
pallone o di questo contro un "legno". 

Durante una gara ciclistica, riprendendo la folla che 
"corre"ai lati degli atleti, si può ottenere un effetto 
sonoro che "viene incontro" e poi si "smorza" alle 
spalle. 

4.3 Ripresa di evento teatrale 

Analogamente al caso di ripresa di orchestra, anche 
in teatro è pensabile di puntare 5 o 6 microfoni 


virtuali in modo fisso e controllare i restanti con 
uno 0 due joystick: è quindi realizzabile una ripresa 
surround, codificata da 5.0 a 7.0. 

4.4 Ripresa di evento televisivo 

In un programma televisivo in studio, si possono 
porre una o due sonde in alto indirizzate verso il 
basso. 

"Puntando" i microfoni virtuali corrispondenti a 
ciascuna sonda con una direttività del quinto o del 
sesto ordine si possono attenuare notevolmente 
i rumori ambientali normalmente presenti nello 
studio televisivo e provenienti dall'alto, quali quelli 
dovuti agli impianti di condizionamento e di movi¬ 
mento motorizzato delle luci. 

4.5 Ripresa di evento radiofonico 

Negli studi radiofonici si potrebbero effettuare 
riprese di spazialità che renderebbe l'utente più 
partecipe di quello che sta ascoltando, avendo 
la sensazione di "vedere" in uno spazio a 360° la 
posizione degli attori, speaker e musicisti presenti. 

4.6 Ripresa di talk-show 

L'inseguimento dinamico reso possibile dal Joystick 
può consentire di riprendere, ad esempio nel corso 
di un talk-show, il giornalista che si muove nello 
studio e si avvicina agli ospiti, eventualmente "pun¬ 
tati" in modo statico dai restanti 6 microfoni, per 
interloquire con loro. 

Ponendo la sonda in alto, sulla platea, è possibile 
"puntare" con il Joystick i singoli componenti del 
pubblico a cui si desidera dare la parola. 

4.7 Ripresa di una scena e riproduzione 

DEL RISULTATO IN UN ALTRO AMBIENTE 

Vi possono essere limitazioni nell'uso del sistema nel 
caso in cui si voglia riprendere ed irradiare il suono 
nello stesso ambiente: infatti, a causa dell'alta sensi¬ 
bilità dei microfoni della sonda, è alta la probabilità 
di innesco (effetto Larsen). 

Può invece trovare ampie applicazioni l'uso del siste¬ 
ma per la ripresa dell'evento e la sua riproduzione in 
tempo reale in uno o più ambienti, anche distanti, 
garantendo Veffetto presenza. 
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4.8 Postproduzione 

Si è detto che le informazioni sonore delle 32 capsu¬ 
le possono essere registrate ed essere quindi dispo¬ 
nibili per nuove rielaborazioni. Ciò apre possibilità 
fino ad ora impensabili a quanto realizzabile in fase 
di postproduzione. 

Sono ridefinibili, in postproduzione, le scelte che 
normalmente devono essere attuate in fase di ri¬ 
presa. E'infatti possibile riposizionare i microfoni 
virtuali nello spazio scenico e ridefinirne la diretti¬ 
vità, fino a raggiungere il risultato atteso. 

La limitazione a 7 microfoni virtuali è legata alla 
attuale capacità di elaborazione in tempo reale 
e in futuro potrà aumentare; è già oggi possibile 
incrementare il numero di microfoni virtuali nella 
fase di postproduzione, ovviamente rinunciando 
alla possibilità di operare in tempo reale. 

5. I PROSSIMI PASSI 

I risultati fino ad ora ottenuti sono molto promet¬ 
tenti. Le sperimentazioni in atto sono effettuate 
con un sistema prototipale: alcuni degli elementi 
componenti (interfaccia, unità di elaborazione, 
console) potranno essere integrati favorendo una 
maggiore trasportabilità e facilità d'uso. 


La verifica, coinvolgendo gli utilizzatori, delle varie 
ipotesi di impiego, in situazioni ambientali differenti 
e con varie tipologie di generazione sonora, è indi¬ 
spensabile per individuare un sistema utilizzabile 
nella produzione radiotelevisiva, obiettivo della 
attività di ricerca e sviluppo avviato dal Centro Ri¬ 
cerche Rai. 

Il coinvolgimento dell'industria è essenziale per 
sviluppare un prodotto che, in base alle indicazioni 
fino qui ottenute, sembra avere notevoli potenzialità 
di impiego e diffusione. 

Appendice 

La teoria Ambisonic 

L'Ambisonic è un metodo di registrazione, o campio¬ 
namento, e riproduzione delle informazioni inerenti 
ad un determinato campo sonoro. 

Conoscendo infatti pressione e velocità delle par¬ 
ticelle d'aria in un determinato punto dello spazio, 
si posseggono tutte le informazioni necessarie per 
ricreare in modo fedele il campo sonoro. E' possi¬ 
bile sfruttare questi due parametri in due principali 
direzioni: sintesi di microfoni o riproduzione audio 
surround. 
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Negli anni 70 Michael Gerzon realizzò la prima 
sonda in grado di campionare pressione e velocità 
in un punto, sfruttando una disposizione tetraedrica 
di capsule microfoniche con direttività a cardioide. 

Sfruttando tre microfoni a figura di otto e un mi¬ 
crofonoomnidirezionale, teoricamente coincidenti, 
si potrebbe pensare di campionare le armoniche 
sferiche (funzioni direzionali) di ordine 0 e ordine 
1: il segnale omnidirezionale dà le informazioni 
sulla pressione (W), i tre segnali rimanenti, orien¬ 
tati secondo gli assi cartesiani, sono proporzionali 
alla velocità delle particelle d'aria attorno al punto 
d'origine 


Le capsule, anche in questo caso, non sono coinci¬ 
denti: l'approssimazione introdotta si traduce nel 
disallineamento tra le capsule in termini di tempo/ 
fase che porta alla "colorazione" (filtraggio) dello 
spettro dei segnali B-format. 


Per ogni ordine"m"ambisonicci sono (2m-i-1) com¬ 
ponenti (figura Al). 

Nell'impossibilità di avere a disposizione 4 microfoni 
coincidenti, Gerzon pensò di utilizzare 4 capsule con 
direttività a cardioide poste sulle facce di un tetra¬ 
edro. La conversione dei segnali delle capsule (A- 
format) in quelli Ambisonics del 1 °ordine (B-format) 
avviene tramite una semplice serie di somme e sot¬ 
trazioni ottenendo una serie di segnali virtualmente 
provenienti da altre direzioni (figura A2): 

W = C1-hC2-hC3-hC4 
X = C1+C2-C3-C4 
Y = C1-C2 -hC3-C4 
Z = C1-C2-C3+C4 



Fig. A2 - Microfono tetraedrico 






3D - Virtual Microphone System 

Sonda Microfonica ad Elevata Direttività 


Testo e figure tratti dall'articolo di Leonardo Scopece (Rai), Angelo Farina e Andrea Capra 
(Università di Parma - Dipartimento di Ingegneria Industriale) 
pubblicato su Elettronica e Telecomunicazioni, Aprile 2011. 


1. Introduzione 

Il precedente capitolo illustra l'attività di ricerca 
avviata dal Centro Ricerche della Rai e dal Dipar¬ 
timento di Ingegneria Industriale dell'Università 
di Parma che ha portato alla progettazione e rea¬ 
lizzazione di un sistema di ripresa e registrazione 
basato sulla tecnica Ambisonic. Il sistema utilizza 
una sonda HOA ed è stato denominato 3D-VMS. I 
risultati conseguiti hanno consentito la definizione 
di un brevetto, depositato dalla Rai e da AIDA, spin- 
off dell'Università di Parma. 

Il sistema ideato sfrutta una sonda microfonica a più 
capsule per consentire una flessibilità di impiego 
nelle produzioni audio/video in campo broadcast 
non ottenibile con i modelli microfonici "discreti" 
disponibili sul mercato. 

I modelli microfonici discreti possono essere mon¬ 
tati direttamente su telecamera e il loro movimento 
può essere sincronizzato automaticamente al mo¬ 
vimento camera, ma non sono in grado di zoomare 
nel campo sonoro. 

il singolo microfono in posizione fissa restituisce 
come risultato una ripresa sonora "statica", che non 
corrisponde alla dinamica video correntemente im¬ 
piegata nel broadcast, dove l'immagine non rimane 
fissa per più di pochi secondi. 


Il sistema 3D-VMS consente una ripresa multimi- 
crofonica o, in alternativa, surround, consente di 
realizzare lo zoom microfonico in modo dinamico e 
d in tempo reale, consente di posizionare più punti 
di ripresa sul piano azimutale e mediano (fino a 7 
microfoni virtuali). 

Questo capitolo aggiorna il precedente, relativo alle 
attività del 2010, fornendo ulteriori dettagli sulle 
basi di funzionamento del sistema e considerazioni 
sulle sperimentazioni in diversi ambienti e campi di 
applicazione. 

2. Microfoni virtuali 

Negli ultimi anni sono state avviate diverse attività di 
ricerca per sviluppare tecnologie atte a registrare e 
riprodurre le proprietà spaziali del suono. Molti de¬ 
gli approcci proposti fanno uso di grandi schiere di 
microfoni e altoparlanti per elaborare i segnali sulla 
base di teorie matematiche complesse, evoluzioni 
del classico principio di Huygens. 

Questi metodi si basano su rappresentazioni mate¬ 
matiche del campo sonoro, che viene decomposto 
in onde piane [1], in armoniche sferiche [2] o fun¬ 
zioni complesse di Hankel [3]. 

Qualunque metodo venga utilizzato, alla fine ci si 
può ricondurre al calcolo come sintesi di un numero 
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di microfoni virtuali, ciascuno dei quali alimenta un 
altoparlante nel sistema di ascolto. 

L'approccio scelto non utilizza nessuna rappresen¬ 
tazione matematica del campo sonoro, vuole invece 
identificare una soluzione numerica in grado di 
ottenere direttamente i coefficienti dei filtri utili a 
sintetizzare ciascun microfono virtuale con diretti¬ 
vità e direzione di puntamento arbitrari. 

Sebbene questo approccio possa funzionare, in 
linea di principio, con qualsiasi tipo di geometria 
della schiera di microfoni, si è deciso di sviluppare 
il sistema utilizzando una sonda microfonica sferica 
costituita da 32 capsule di elevata qualità, recente¬ 
mente disponibile sul mercato. 

I 32 segnali sono filtrati impiegando un potente 
processore di convoluzione, capace di sintetizzare 
in tempo reale fino a 7 microfoni virtuali e di defi¬ 
nire la loro posizione e direttività utilizzando come 
dispositivo di controllo un joystick o un mouse; 
la gestione del sistema da parte dell'operatore è 
facilitata dall'uso di una videocamera panoramica 
a grand'angolo e di una una interfaccia grafica di 
uso intuitivo. 

La gestione può avvenire in tempo reale e con bassi 
tempi di latenza durante un evento dal vivo. In 
alternativa, i segnali "grezzi" delle 32 capsule pos¬ 
sono essere registrati, insieme al video panoramico, 
consentendo la loro elaborazione e la sintesi dei 
microfoni virtuali in fase di post-produzione. 

I microfoni virtuali sintetizzati possono essere alta¬ 
mente direttivi (con diagrammi polari costanti con la 
frequenza, e con apertura del fascio di ripresa molto 
definita come quella di un microfono"a fucile"); sono 
intrinsecamente coincidenti, in modo da miscelare i 
segnali senza problemi di comb-filtering; è possibile 
muovere continuamente i microfoni sulla scena 
per seguire attori e/o cantanti, o per dare voce al 
pubblico presente. 

La registrazione di un concerto è solo uno dei possi¬ 
bili scenari in cui utilizzare questo schema; un altro 
fra gli scenari testati è quello teatrale. 

Un'attenta analisi delle prestazioni del nuovo si¬ 
stema microfonico ha mostrato che la risposta in 
frequenza, il rapporto segnale-rumore e la reiezio¬ 
ne del suono al di fuori del fascio di ripresa sono 


M ingressi \/uscite 



Fig. 1 - Schema di elaborazione dei segnali. 

migliori di quelli ottenuti impiegando algoritmi 
di elaborazione tradizionali applicati agli stessi se¬ 
gnali d'ingresso, o di microfoni altamente direttivi 
dedicati. 

3. Descrizione del sistema 

3.1 Filtri digitali per microfoni virtuali 

Dato un array di trasduttori, si può utilizzare un set 
di filtri digitali per creare i segnali in uscita (figura 1 ). 
Nel nostro caso occorre convertire gli M segnali che 
arrivano dalle capsule in l/segnali corrispondenti ai 
microfoni virtuali desiderati: è necessario utilizzare 
una matrice di filtri FIR. 

Assumendox^ come segnali di ingresso di M micro- 
foni,y^come segnali di uscita di V microfoni virtuali 
e h^Ja matrice di filtri, i segnali elaborati possono 
essere espressi come: 

M 

m=\ 

Dove * rappresenta la convoluzione, e quindi cia¬ 
scun segnale del microfono virtuale è ottenuto 
sommando i risultati delle convoluzioni degli M 
ingressi con un opportuno set di M filtri FIR. 
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Fig. 2 - Diagramma polare di microfoni virtuali 
a cardioide di vari ordini. 


In via di principio questo approccio permette di 
sintetizzare microfoni virtuali aventi un pattern di 
direttività arbitrario. In pratica si è deciso, per ora, 
di sintetizzare microfoni virtuali a cardiode di ordine 
superiore indipendenti dalla frequenza, come mo¬ 
strato in figura 2, e specificare la direzione di punta¬ 
mento in coordinate polari (azimuth ed elevazione). 


I coefficienti dei filtri h sono normalmente calcolati 
seguendo una delle complesse teorie matematiche, 
basate sulla soluzione dell'equazione d'onda [1,2,3], 
spesso sotto alcune semplificazioni, si assume che i 
microfoni siano ideali e identici. 

I criteri di progetto seguiti, invece, non sono basati 
sulla scelta di una teoria specifica: il set di filtri h 
sono derivati direttamente da set di misure, fatte 
all'interno di una camera anecoica. 

E' costruita una matrice di coefficienti di risposta 
all'impulso in base alle misure; la matrice inversa è 
calcolata numericamente (impiegando tecniche di 
approssimazione, come il metodo dei Minimi Qua¬ 
drati più la regolarizzazione); in questo modo le usci¬ 
te dell'array microfonico sono in linea di massima 
molto prossime alle risposte ideali. Questo metodo 
corregge anche deviazioni del trasduttore e artefatti 
acustici (schermatura, diffrazione, riflessione, ecc.). 

I dettagli matematici per il calcolo dei coefficienti 
dei filtri sono illustrati in [4]. 

3.2 II modello microfonico 

La sperimentazione descritta in questo articolo è 
stata realizzata usando l'array microfonico Eigen- 
mike™ prodotto dalla MH Acoustics [5]. 

Questa sonda microfonica (figura 3) è costituita da 
una sfera di alluminio, di raggio pari a 42 mm con 



Fig. 3 - sonda microfonica. 



Fig. 4-11 sistema microfonico nella camera anecoica. 
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32 capsule di alta qualità posizionate sulla 
sua superficie; i microfoni, preamplificati 
e convertiti da analogico in digitale sono 
all'Interno della sfera e tutti i segnali sono 
trasferiti all'interfaccia audio utilizzando un 
cavo CAT-6 e protocollo Ethernet basato su 
A-net. 


L'interfaccia audio è denominta EMIB: basa¬ 
ta sul chip TCAT DICE II, opera con i sistemi 
operativi Windows, OSX e Linux utilizzando 
FFADO. La scheda dispone di due uscite 
analogiche in cuffia, un'uscita digitale ADAT 
e una porta word clock per sincronizzarsi con 
apparati esterni. 

Il sistema è in grado di registrare 32 canali 
con una risoluzione di 24 bit, e con frequenza 
di campionamento di 44,1 o 48 kFIz. 

Il controllo dei guadagni dei preamplificatori 
avviene attraverso il controllo MIDI; è stata 
sviluppata una GUI in linguaggio Python per 
permettere un semplice controllo del gua¬ 
dagno in tempo reale, con nessuna latenza 
e nessuna interruzione. 

3.3 Caratterizzazione sperimentale 

DEL MODELLO 

Le misure dell'array microfonico sono state 
effettuate impiegando il metodo ESS, allo 
scopo di ottenere 32 risposte all'impulso per 
ciascuna direzione di arrivo del segnale test. 

Tali misure sono state effettuate all'interno di 
una camera anecoica, per evitare riflessioni 
indesiderate e per massimizzare il rapporto 
segnale/rumore. 

L'altoparlante e la camera anecoica sono sta¬ 
te gentilmente forniti dalla Eighteen Sound 
di Reggio Emilia, che ha anche provveduto 
all'uso di un altoparlante di alta qualità per 
le misure, come mostrato in figura 4. 

Il sistema è stato ruotato lungo l'azimuth (di 
36 passi) e in elevazione (di 18 passi) usan¬ 
do un'attrezzatura mobile per la rotazione 
azimutale e una piattaforma girevole per 
l'elevazione. In questo modo si sono ottenu¬ 
te 36x18x32 risposte all'impulso, ciascuna di 
2048 campioni (a 48 kFIz). 


Ri9po«l« in dirtzicn* di m*$tim« direttività P*) (-SdB 70*) 



•180 -90 0 90 180 


Azimut (•] 


Fig. 5 - Cardioide del 3° ordine. 



Azimut [*] 


Fig. 6 - Cardioide del 6° ordine. 


3.4 Sintesi e test dei microfoni virtuali 

Per ottenere la matrice di filtri è stato realizzato uno script 
MATLAB. 

La convoluzione della matrice dei FIR con i 32 segnali 
provenienti dalle capsule dell'array, deve fornire come 
uscite i segnali dei microfoni virtuali con le caratteristi¬ 
che desiderate. Nelle figure 5 e 6 sono riportati risultati 
sperimentali che mostrano alcuni dei differenti profili di 
direttività ottenuti. 
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3.5 Architettura e 

Interfaccia Grafica per l'Utente 

Affinché un sistema venga usato in produzioni 
broadcast deve essere molto "robusto", senza com¬ 
plessità non necessarie. Occorre disporre di un'ele¬ 
vata potenza di calcolo per generare ed utilizzare in 
tempo reale i filtri FIR con basso tempo di latenza. A 
tale scopo il sistema è dotato di un'unità di elabora¬ 
zione dei segnali dedicata, contenente una scheda 
madre mini-ITX molto potente con un processore 
Quad Core. L'elaborazione dei dei segnali audio 
viene effettuata da questa unità. 

Per il controllo visuale delle caratteristiche di ogni 
microfono virtuale viene utilizzato un notebook 


comunicante con l'unità di elaborazione tramite 
rete IP; per modificare in tempo reale le direttività 
e gli orientamenti dei microfoni virtuali l'utente ha 
a disposizione un joystick o un mouse (figura 7). 

Lo schema in figura 8 rappresenta l'architettura soft¬ 
ware adottata nell'unità di elaborazione dei segnali. 

L'interfaccia utente è progettata allo scopo di se¬ 
guire gli attori o le sorgenti in movimento, dando 
modo di verificare la posizione dei segnali audio dal 
vivo. A questo scopo, la GUI (figura 9) permette di 
focalizzare i microfoni su uno flusso video partendo 
da una camera di sorveglianza panoramica, posta 
in prossimità della sonda microfonica. 



Fig. 7 - Componenti hardware del sistema, a Sonda microfonica, b interfaccia EMIB, c Unità di elaborazione dei segnali, 
d console di controllo (notebook), e dispositivo di puntamento (joystick); f cavo CAT 6, in questa applicazione può ope¬ 
rare fino ad una lunghezza di 140 m, g interfaccia ottica ADAT, h interfaccia firewire, i collegamento via cavo Ethernet 
CAT 5 o WiFi, I collegamento via cavo o wireless. 
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Fig. 9 - GUI. Si noti lo 
slider utile per regolare 
la trasparenza dei pun¬ 
tatori colorati sovrappo¬ 
sti all'immagine video. 
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Fig. 10 - Torino, 13 maggio 
2010. Concerto di musica 
classica presso Auditorium 
Rai. 


4. Esempi di applicazione e sperimentazioni 

Nel capitolo precedente sono elencate le tipolo¬ 
gie di eventi in cui il sistema può essere applicato 
vantaggiosamente: ripresa di orchestra , ripresa 
di eventi sportivi, teatrali, televisivi, radiofonici, di 
talk show e diffusione di una scena in un ambiente 
diverso da quello di ripresa. 

Nel corso degli ultimi mesi sono state effettuate 
numerose sperimentazioni, verificando le caratte¬ 
ristiche del sistema nelle varie condizioni di ripresa, 
produzione e post-produzione. In alcuni casi sono 
stati messi a confronto il sistema olofonico (micro¬ 
fono Holophone H2Pro) ed il sistema 3D-VMS. 

4.1 Concerto presso Auditorium 

Una prova relativa alla ripresa di un concerto è stata 
effettuata presso l'Auditorium Rai a Torino (figura 
1 0). La prova comparativa fra la ripresa con microfo¬ 
no olofonico e sistema 3D-VMS è avvenuta nel corso 
delle prove generali di un concerto di Sostakovich. 

I due tipi di microfono sono stati posti su due aste, 
molto vicine tra loro. 

II risultato, con la posizione delle aste alle spalle 


del Direttore d'Orchestra, è risultato molto buono, 
presente e gradevole per entrambe le tipologie. 

Il prodotto registrato con il microfono olofonico è 
più"squillante", ma ciò non implica necessariamente 
maggior gradevolezza rispetto a quello ottenuto 
con il sistema 3D-VMS. E' stato notato in alcuni 
momenti una leggera controfase sul prodotto olo¬ 
fonico, assente nel caso del sistema 3DVMS. 

4.2 Concerto presso Studio Radiofonico 

La ripresa è avvenuta in occasione del concerto in 
ricordo del terremoto de L'Aquila "Per non dimenti¬ 
care", in uno Studio Radiofonico Rai. 

Anche in questo caso (figura 1 1) la sonda micro¬ 
fonica era posta al centro, alle spalle del Direttore 
d'Orchestra. Sulla stessa staffa erano disposti una 
telecamera per l'interfaccia di servizio del sistema 
3D-VMS ed il microfono olofonico. 

Il risultato sonoro è stato soddisfacente, anche 
grazie all'acustica dello studio ed alla presenza del 
pubblico, che ha costituito un buon assorbitore. 

Il giudizio sul confronto con il microfono olofonico 



48 


Teoria Ambisonica e 3D-VMS 


/ a b 







Fig. 11- Roma, 14 aprile 
2010. Concerto di musica 
classica presso 
Studio Radiofonico Rai in 
Via Asiago. 


è da considerarsi puramente soggettivo: il segnale 
olofonico è sembrato meno cupo dell'ambisonico, 
ma in generale meno soddisfacente. 

4.3 Programma in 

Studio Televisivo 

La sperimentazione di ripresa effettuata durante 
la realizzazione una puntata del programma Mele- 
visione (figura 12) ha ottenuto risultati poco signi¬ 
ficativi a causa della distanza a cui ci si è posti con 


la sonda per non intralciare il lavoro degli addetti, 
infatti la scenografia, tipica del format, occupa la 
maggior parte dello spazio di scena. 

Malgrado le condizioni non favorevoli, il suono delle 
voci è risultato buono, anche se in alcuni momenti 
"fuori fuoco". 



Fig. 12- Torino, 9 settembre 
2010. Programma televi¬ 
sivo Melevisione presso 
Studio TV al Centro di 
Produzione Rai. 
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Fig. 13- Torino, 21 maggio 
2010. Un'immagine delle 
prove generali dell'opera "Bo¬ 
heme" presso il Teatro Regio. 



4.4 Opera lirica:"La Bohème" al Teatro Regio 

Il sistema 3D-VMS è stato utilizzato nel corso delle 
prove generali, presente il pubblico, de "La Bohème" 
al Teatro Regio di Torino (figura 13). 

La sonda microfonica, per motivi di regia, è stata 
posta su un'asta davanti alla prima fila in platea, ma 
non in posizione centrale, leggermente spostata 
verso destra di circa 20'" rispetto al centro, guardan¬ 
do il palcoscenico, con la fossa dei musicisti tra la 
sonda stessa ed il proscenio. 


assoli le voci era riprodotte in modo più pulito, pur 
risultando comunque troppo distanti. 

4.5 Teatro: "Arlecchino" AL Piccolo 

Purtroppo nel caso della ripresa di "Arlecchino ser¬ 
vitore di due padroni" al Piccolo Teatro di Milano è 
stato possibile posizionare la sonda solo in un luogo 
particolarmente infelice (figura 14): in galleria in po¬ 
sizione laterale, con una visione del palco veramente 
minima, con un'apertura di circa 10'". 



Fig. 14- Milano, 20 ottobre 2010. Il Piccolo Teatro e la 
scena di "Arlecchino, servitore di due padroni", registrato 
in 3D HDTV per il video e 3D-VMS per l'audio. Nella foto 
panoramica è visibile la sonda microfonica e valutabile la 
posizione inidonea ad essa assegnata. 


La sperimentazione ha consentito di verificare la 
possibilità, in post-produzione, di "traslare" al cen¬ 
tro i 7 microfoni virtuali, mantenendo il rapporto 
spaziale tra loro. 

Dal punto di vista acustico non si è ottenuto un 
buon risultato perché le voci dei cantanti erano 
molto lontane e inoltre"disturbate"fortemente dalla 
musica proveniente dalla fossa. Solo nel caso degli 


Il recupero dell'informazione sonora ha richiesto un 
impegnativo lavoro di post-produzione, durato più 
di due settimane. Il risultato ha superato le più ro¬ 
see aspettative, è stato possibile "estrarre"il parlato 
dei vari attori anche nelle condizioni più critiche (di 
schiena, lontani dal microfono, bisbiglio). 
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Fig. 15 - Torino, 22 novem¬ 
bre 2010. Concerto presso 
il Salone del Conservatorio 
Giuseppe Verdi. 



Fig. 16- Milano, 27-28 febbraio 
e1 marzo 2011. Composizione 
"Mise en abime" presso lo Studio 
3 del Centro di Produzione Rai. 
Nel riquadro il compositore, sulla 
sinistra, analizza le caratteristiche 
volute per la ripresa mediante il 
sistema 3D-VMS. 


4.6 Concerto in Sala del Conservatorio 

Durante il Concerto in re maggiore op.35 per violino 
e orchestra di Tchaikovsky (figura 15), l'asta con la 
sonda microfonica è stata posizionata al centro e 
alle spalle del direttore d'orchestra. 

Il risultato ottenuto è stato molto soddisfacente, 
ha richiesto pochissimo lavoro di post-produzione. 

Quando è possibile posizionare il microfono nel 
punto ottimale, frontale, si ottiene la miglior regi¬ 
strazione e l'effetto "pubblico" non risulta troppo 
disturbante. 

4.7 Concerto in Studio Televisivo 

"Mise en abìme"(in italiano"messa in abisso") è una 
composizione del M° Yuval Avital, creata per un 
organico strumentale e corale di massa, utilizza lo 
spazio come un elemento essenziale della partitura. 


La Rai, in accordo e in collaborazione con il Teatro 
Franco Parenti, con Maga Global Arts e l'Università 
di Milano, ha sperimentato l'uso del sistema 3D-VMS 
per riprendere questa particolare composizione. 

La ripresa sperimentale è stata effettuata allo Studio 
3 del Centro di Produzione Rai di Milano (figura 16). 

L'ensemble musicale, disposto su una circonferenza, 
è particolarmente articolato e complesso composto 
da 32 fisarmoniche, 2 fisarmoniche basse, 2 bassi 
tuba, 1 clarinetto basso, 1 soprano, 1 percussione e 
1 didgeridoo. Il coro è costituito da oltre 100 voci 
di non professionisti disposti su una circonferenza 
esterna ed esegue una partitura alfabetica e grafica. 
I direttori sono quattro, due per il coro e due per gli 
strumenti. 
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La sonda microfonica è stata posta al centro delle 
due circonferenze. Inoltre, per avere un eventuale 
rinforzo sonoro, si sono utilizzati ulteriori 8 microfoni 
cardiodi a copertura di una suddivisione ideale della 
scena in 8 settori. 

Dalle riprese è stato realizzato un prodotto quadri- 
fonico di buona qualità, obiettivo della sperimen¬ 
tazione. 

4.8 Opera lirica: "Nabucco" a Montecitorio 

Le condizioni di ripresa dell'opera il"Nabucco"pres- 
so la Camera dei Deputati di Montecitorio (figura 
1 7) e interpretata dall'Orchestra dell'Opera di Roma 
diretta dal Maestro Riccardo Muti non sono state, 
purtroppo, ottimali. 

Infatti non è stato possibile collocare la sonda mi¬ 
crofonica al centro dell'Orchestra, come inizialmente 
si era ipotizzato, poiché l'asta avrebbe"impallato"la 
ripresa video. La sonda è stata pertanto posizionata 
in galleria, ad una quindicina di metri dall'Orchestra, 
alle spalle del Maestro. 

Questa limitazione, aggiunta all'acustica non ot¬ 
timale della Camera, è la causa del risultato non 
entusiasmante, con l'eccezione dei pieni di orchestra 
e del coro. 

4.9 Opera lirica:"Rigoletto"alTeatro Regio 

La sperimentazione basata sulla ripresa del "Rigo- 
letto"al Teatro Regio (figura 18) aveva l'obiettivo di 
valutare un'applicazione più articolata del sistema 
3D-VMS. 



Fig. 17- Roma, 22 marzo 2011. Opera lirica "Na¬ 
bucco" alla Camera dei Deputati. 


E'stata utilizzata una sola sonda microfonica, posta 
all'inizio del proscenio e quasi al centro vicino alla 
buca del suggeritore, per ottenere la registrazione 
dei 32 canali. Nella fase di post-produzione sono 
stati sintetizzati 7 microfoni frontali, puntati verso i 



Fig. 18- Torino, 9 aprile 
2011. Opera lirica "Rigoletto" 
al Teatro Regio. 
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Fig. 19- Torino, 20 aprile 

2011. Opera lirica 

"La Traviata" al Teatro Regio. 



cantanti, e, a partire dalla stessa registrazione mul¬ 
ticanale, sono stati sintetizzati ulteriori 7 microfoni 
puntati in direzione opposta, verso l'orchestra. Al 
momento della pubblicazione di questo articolo, 
non è ancora stato analizzato il risultato, ma si hanno 
buone aspettative, sulla base della percezione in 
cuffia nel corso della ripresa. 

4.10 Opera lirica: "Traviata" al Teatro Regio 

Nel caso de "LaTraviata" (figura 19) si sono utilizzate 
due sonde microfoniche: una nella stessa posizione 
utilizzata per il "Rigoletto", la seconda posizionata 
su un'asta dentro la fossa, alle spalle del Direttore 
d'Orchestra. Il risultato della ripresa non è ancora 
stato analizzato, ma si suppone, con questa configu¬ 
razione, di poter ottenere una riproduzione meglio 
definita delle componenti sonore, cantanti e or¬ 
chestra. Sarà possibile valutare i possibili problemi 
di fase dovute alla miscelazione delle registrazioni 
provenienti dalle due sonde e le eventuali implica¬ 
zioni sul prodotto finale. 

5. Conclusioni 

L'obiettivo del progetto era la realizzazione di un 
sistema microfonico capace di sintetizzare un signi- 
fiativo numero di microfoni virtuali, per i quali fosse 
possibile modificare dinamicamente e in tempo 
reale posizione e direttività. Il sistema sviluppato 
consente la definizione di microfoni virtuali i cui 


diagrammi polari possono variare con continuità 
dalle tipologie standard (come ominidirezionale o 
cardiode) fino a cardiodi molto direttivi del 6° ordine, 
tipologia di direttività risultata più stretta di quella 
dei microfoni "a fucile". 

La metodologia di progetto adottata offre signifi¬ 
cativi vantaggi: 

la possibilità di operare in un ampio intervallo di 
frequenze, per una data dimensione della sonda; 

correzione delle differenze costruttive delle 
capsule; 

correzione parziale di artefatti acustici quali ef¬ 
fetti di mascheramento, diffrazioni e risonanze. 

Particolare attenzione è posta alle caratteristiche 
operative, specifiche per le applicazioni previste: 

la sonda microfonica è stata adattata apposita¬ 
mente alle specifiche indicate per uso broadcast: 
il colore non è riflettente alle luci di scena, è 
dotata di manico per renderne assimilabile l'uso 
a quello di un microfono, opera alla frequenza 
standard professionale pari a 48 kHz. 

'4 l'interfaccia utente (GUI) è di uso semplice. 

è in corso l'unificazione delle due unità, quella 
di elaborazione dei segnali e quella di controllo 
(utilizzata per la registrazione e l'interfaccia 
utente); anche l'elaborazione sarà affidata al 
notebook (l'attuale unità di controllo) grazie 
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airincremento delle capacità di elaborazione 
delle CPU. 

'C di conseguenza è facilitata la sincronizzazione 
della ripresa video di servizio (necessaria per 
il puntamento dei microfoni virtuali) e del 
time-code, indispensabile per le operazioni di 
produzione e post-produzione. 

il sistema fornisce un approccio rivoluzionario alla 
ripresa del suono nel campo dei broadcaster e nelle 
produzioni di film e musica e le innovazioni previste 
comportano a breve il superamento delle attuali 
limitazioni, tipiche di un prodotto destinato alla 
sperimentazione, con miglioramenti significativi 
dal punto di vista operativo, tecnico e di ingombro. 

L'estesa gamma di sperimentazioni ha dimostrato 
che, grazie alla flessibilità operativa, può trovare 
applicazione in produzione ed in post-produzione. 
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3D-VMS 


Virtual Microphone System 
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pera 



Testo e figure tratti dall'articolo di Leonardo Scopece pubblicato su Elettronica e 
Telecomunicazioni, Agosto 2011 


1. L'Evoluzione 

Il sistema denominato 3D-VMS, basato sulla teoria Ambisonic, utilizza 
una sonda a più capsule per realizzare la ripresa multimicrofonica e con¬ 
sente di posizionare più punti di ripresa sul piano azimutale e mediano 
(fino a 7 microfoni virtuali). 

Il sistema è oggetto di evoluzione dal punto vista sia della configurazione 
hardware, sia dell'interfaccia utente. 

La configurazione illustrata nel capitolo precedente comprendeva una 
sonda microfonica collegata con l'interfaccia EMIB all'unità di elabora¬ 
zione (in pratica un PC quad-core) dei segnali controllata da una console 
(un MacBook). 

Dal punto di vista hardware, l'evoluzione del sistema consente ora di 
affidare ad un MacBook quad-core di svolgere sia le funzioni di unità di 
elaborazione sia di console che provvede alla GUI. 

Questa innovazione è molto importante, sia dal punto di vista operativo, 
perché semplifica parecchio il compito del tecnico dedicato a gestire il 
sistema, sia per lo sviluppo delle potenzialità future. 

Sarà possibile avere una sincronizzazione audio/video di servizio tramite 
due"gruppi"di segnali che viaggiano su cavo IP e sarà facilitata l'introdu¬ 
zione del Time Code, il codice temporale necessario alla sincronizzazione 
dei segnali audio provenienti dalla sonda con i segnali video provenienti 
dalle telecamere utilizzate durante le riprese televisive. 

Le prestazioni del sistema sono state giudicate adatte per la sua utiliz¬ 
zazione per la ripresa dell'opera "Lucia di Lammermoor"al Teatro Regio 
di Torino, diffusa in diretta su Rai Radio 3 sulla rete Euroradio. 
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2. La Nuova Interfaccia 

I suggerimenti dei colleghi della Produzione sono 
stati importanti per consentire il miglioramento 
notevole dell'interfaccia utente, fino a pervenire 
alla versione attuale. Le novità dal punto di vista 
operativo hanno consentito di realizzare le prove 
di registrazione e di montaggio e infine di adottare 
il sistema per la diffusione in diretta. 


produzione che presenta, come elemento centrale, 
una fotografia della scena che"abbraccia"un campo 
visivo da 360° azimutali. 

Si possono notare alcune peculiarità di cui la vecchia 
interfaccia non era provvista: 

la possibilità di visualizzare i minimi di guada¬ 
gno dei microfoni virtuali, rappresentati come 
"X"(Notch); 


In figura 1 è rappresentata l'interfaccia di post- 


le circonferenze, che rappresentano le quan¬ 
tità di profondità di guadagno (la direttività), 
corrispondono ad una attenuazione rispetto al 
centro pari a 6 dB; 


è possibile andare in Play, Pause e Stop durante 
d - Selezione e scelta del dispositivo l'analisi del segnale audio, controllando il segna- 

audio collegato al MacBook le qualunque momento (a); 



Fig. 1 - Impostazioni in post-produzione. 
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si può agire ne\‘‘camp\"Azimut, Elevation e Order 
anche impostando direttamente i valori (b); 

attivando Selection Button/Mouse si seleziona 
uno dei microfoni in scena; nella versione pre¬ 
cedente, essendo i cerchi vicini tra loro, poteva 
accadere che la selezione, e il conseguente 
movimento, agisse su un microfono diverso da 
quello voluto (c); 

si può agire sul guadagno di ingresso al Mac, 
nella sua funzione di registratore audio, attra¬ 
verso un dosatore virtuale; 

inoltre si ha il monitoraggio dei livelli dei 32 
microfoni, aprendo ad es. il software di regi¬ 
strazione Plogue Bidule e selezionando Monitor; 

'A si può scegliere il dispositivo audio da utilizzare 
(d), tra RME Fireface 400 o 800, EMIB o il MacBo- 
ok stesso (in questo caso per due soli microfoni 
virtuali); 


Anche l'interfaccia utente relativa al Real-Time è 
stata rivoluzionata (figura 2), dotandola di funzio¬ 
nalità analoghe a quelle disponibili per la post¬ 
produzione: 

è possibile scegliere il numero di microfoni con 
cui operare (1,2 o 7); 

il microfono è selezionabile mediante Selection 
Button/Mouse; 

•/ posizione e direttività del microfono è imposta¬ 
bile direttamente nei rispettivi campi; 

•/ è possibile avere un'idea dello zoom impostato 
osservando nell'apposita finestra il diagramma 
polare del microfono scelto; 

•/ il livello di registrazione è impostabile agendo su 
un dosatore virtuale, in modo da non rischiare 
di saturare il segnale portandolo in distorsione. 


Fig. 2 - Impostazioni in Real-Time 
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3. I TEST 


3.1 Rigoletto 

La ripresa effettuata al Teatro 
Regio delle prove generali del "Ri¬ 
goletto" di Giuseppe Verdi (figura 
3) è stata realizzata con una sola 
sonda microfonica posta al centro, 
sul bordo del palco, allo scopo di 
riprendere sia le voci frontali, sia 
l'orchestra, localizzata posterior¬ 
mente rispetto alla sonda. 

Quando si è analizzato il risultato 
in post-produzione i microfoni 
virtuali sono stati posizionati come 
illustrato in figura 4. 


Fig. 3 - Torino, 9 aprile 2011. Prove generali del "Rigoletto" al Teatro Regio. 



Il risultato sonoro del fronte acustico del cantato è 
molto buono: le voci sono così "presenti" che si ha 
l'impressione che i cantanti siano dotati di radiomi- 
crofono individuale. In complesso, si ha un'aria del 
palco non invasiva e gradevole nella giusta misura 
e la spazialità delle voci corrisponde al reale ed è 
piacevole. 

Per quanto riguarda l'orchestra, invece, il risultato 
non è sufficiente, come d'altronde ci si aspettava. 
Si avverte infatti che i suoni degli strumenti non 
arrivano direttamente alla sonda microfonica, ma 
riflessi dalle pareti della fossa: non sono suoni otte¬ 
nuti mediante microfoni puntati direttamente, sui 


percorsi delle onde sonore generate dagli strumenti 
musicali. 

Questa esperienza ha permesso di individuare una 
configurazione ottimale di ripresa, messa in atto 
successivamente, per la "La Traviata". 

3.2 La Traviata 

Per la ripresa delle prove generali de"LaTraviata"di 
Giuseppe Verdi (figura 5) sono state utilizzate due 
sonde microfoniche: una posizionata nello stesso 
luogo scelto per il "Rigoletto", al centro, sul bordo 
del palco, e una posta alle spalle del Direttore d'Qr- 



Fig.4- Impostazione 
grafica per la ripresa 
del "Rigoletto". 
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Fig. 5 - Torino, 20 aprile 2011. Prove generali de "La Traviata" al Teatro Regio. 





Fig. 6- Impostazione grafica perii palco de "La Traviata". 



0 0 


00 : 00:17 


Fig. 7 - Impostazione grafica per la fossa d'orchestra de "La Traviata". 


chestra e orientata verso il centro 
della fossa. 

Nelle figure 6 e 7 sono illustrate 
le impostazioni per le due sonde: 
quella orientata verso il palco e 
quella orientata verso la fossa. 

Il risultato sonoro è nettamente 
superiore, per quanto riguarda il 
contributo della fossa, rispetto a 
quello ottenuto per il "Rigoletto": 
gli strumenti sono più presenti 
e più "puliti", anche se cambia 
indubbiamente il modo di senti¬ 
re l'orchestra. Gli strumenti non 
vengono percepiti come se fossero 
singolarmente "a fuoco", come nel¬ 
la tecnica di ripresa multimicrofo- 
nica, ma in modo simile all'ascolto 
reale, davanti all'Orchestra. 

Per quanto riguarda il risultato 
relativo al palco, è molto buono e 
fornisce le stesse sensazioni pre¬ 
cedentemente osservate. 

Un potenziale problema potrebbe 
nascere dalla somma dei contri¬ 
buti delle voci sulle due sonde, 
influenzata dai percorsi differenti 
degli stessi. Dal punto di vista 
tecnico le sonde, poste a distanza 
di circa 6 metri tra di loro, ripren¬ 
dono lo stesso suono, ma con un 
certo ritardo. All'ascolto questo 
fenomeno non è risultato udibile, 
probabilmente grazie all'acustica 
del Teatro e al puntamento otti¬ 
male dei microfoni virtuali relativi 
alla fossa. 

L'effetto surround è stato ottenuto 
utilizzando i contributi forniti dai 
microfoni virtuali 4 e 5 sintetizzati 
dalla sonda relativa al palco (figura 
6), mentre non sono stati utilizzati 
i contributi della sonda relativa 
alla fossa, perché influenzati for¬ 
temente dalla superficie riflettente 
costituita dal muro alle spalle del 
Direttore. 
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Fig. 8 - Torino, 21 giugno 2011. 
"Lucia di Lammermoor"al 
Teatro Regio. 


4. In onda 

4.1 Lucia di Lammermoor 

Dopo l'attenta valutazione dei risultati dei test pre¬ 
cedentemente descritti, la Rai ha deciso di utilizzare 
il sistema 3D-VMS nel corso della ripresa della "Lucia 
di Lammermoor"di Gaetano Donizetti (figura 8). 


L'opera è stata trasmessa in diretta da Rai Radio 3 ed 
è stata distribuita da Euroradio'^°‘^'. Infatti è uno dei 
324 concerti che costituiscono VEuroradio Summer 
Festival del 2011. 

In figura 9 è riprodotta l'impostazione grafica dei 
microfoni virtuali definita durante le prove e man¬ 
tenuta durante la diretta. 




Mieropnone :2 




Fig. 9 - Impostazione grafica per la "Lucia di Lammermoor". 


Nota 1 - Euroradio è la 
rete di scambio di pro¬ 
grammi audio digitali di 
alta qualità dell'EBU. 
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Il sistema 3D-VMS è stato adottato per la ripresa 
del palco, mentre la ripresa dell'orchestra è stata 
effettuata in modalità classica multimicrofonica. 

Il suono generato dal sistema 3D-VMS è pieno, pia¬ 
cevole, con mancanza di fading (graduale aumento 
0 decremento del livello del segnale sonoro dovuto 
al passaggio di copertura da un microfono a quello 
adiacente), ottima continuità di ripresa in scena e 
ottima disposizione in profondità e ampiezza delle 
voci che si svolgono sul palcoscenico. 

I segnali elaborati dal sistema 3D-VMS sono consi¬ 
derati alla stessa stregua di segnali provenienti da 
microfoni posti in scena e mixati insieme a quelli 
provenienti dai microfoni posti nella fossa (figura 
10 ). 

II ritardo dei segnali elaborati dal sistema 3D-VMS 
rispetto a quelli reali è di 134 ms. Di conseguenza 
è stato introdotto un ritardo analogo sui segnali 
provenienti dai microfoni convenzionali. 


5. Eventi non ancora analizzati 

Citiamo due ulteriori eventi, che saranno oggetto 
nel prossimo futuro di analisi con il sistema 3D-VMS 
in post-produzione. 

Il 16 maggio 2011 presso lo Studio 3 del Centro 
di Produzione TV Rai di Milano è stata ripresa la 
West-Eastern Divan Orchestra diretta dal M° Daniel 
Barenboim. Sono state eseguite due parti estrapo¬ 
late dalla "Eroica" di Beethoven e dalla "Patetica" di 
Tchaikovsky, diffuse nel corso della puntata di "Che 
tempo che fa" condotta da Fabio Fazio su Rai 3. 

La sonda microfonica è stata sospesa all'altezza dei 
proiettori luci sopra l'orchestra. 

Il 29 giugno 2011, in collaborazione con Radio Vati¬ 
cana, è stata realizzata la ripresa della celebrazione 
della Santa Messa da parte di Sua Santità presso la 
Basilica di San Pietro in Vaticano, con la partecipa¬ 
zione del Coro e dell'Orchestra di Santa Cecilia e 
del Coro della Sistina dello Stato Città del Vaticano, 
diretto da Don Massimo Palombella. 



Le riprese audio sono 
state effettuate sia dalla 
Radio Vaticana, sia dalla 
Rai. La Rai ha utilizzato 
due microfoni 3D-VMS, 
e un microfono Holopho- 
ne H2Pro. 


Fig. 10- Mixaggio dei 7 segnali ottenuti in live 
dal sistema 3D VMS e dei microfoni della fossa. 
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"Elettronica e Telecomunicazioni", 
nata nel 1952 come "Elettronica e Televisione 
Italiana" è una rivista quadrimestrale di Rai Eri 
realizzata dal Centro Ricerche e Innovazione 
Tecnologica della Rai, sul cui sito è disponibi¬ 
le gratuitamente dal 2001. 

Il Centro Ricerche e Innovazione Tecnologica 
(CRIT) della Rai nasce a Torino nel 1930 come 
"Laboratorio Ricerche" e dal 1960 ha sede in 
Corso Giambone 68. Successivamente assume 
la denominazione "Centro Ricerche" e, 
dall'ottobre 1999, quella attuale. 

L'attività del Centro è coordinata dalla 
Direzione Strategie Tecnologiche. 

Alla nascita, tra i suoi obiettivi ha la progetta¬ 
zione e realizzazione di impianti ed apparati 
di nuova concezione, non reperibili sul mer¬ 
cato. I profondi cambiamenti nello scenario 
delle telecomunicazioni hanno stimolato la 
trasformazione del Centro. 
f'I Ha ricevuto riconoscimenti a livello interna¬ 
zionale per i contribuiti forniti alle attività di 
studio e normalizzazione dei sistemi per la 
codifica dei segnali audio e video in forma 
digitale, allo sviluppo delle tecniche di com¬ 
pressione dei segnali attualmente alla base 
dei sistemi di trasmissione e registrazione dei 
segnali video, alla definizione degli standard 
di diffusione e trasmissione DVB. 

Il Centro contribuisce all'evoluzione delle 
tecnologie relative al sistema radiotelevisivo 
e multimediale e supporta il Gruppo nelle 
scelte di indirizzo tecnologico e nella fase di 
sperimentazione e introduzione in esercizio di 
nuovi prodotti e sistemi. E'attivo in numerosi 
progetti finanziati in ambito europeo e nazio¬ 
nale e collabora con Università e Industrie per 
l'attività di ricerca, per la definizione dei nuovi 
standard e lo sviluppo dei nuovi servizi. 
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